新闻详情

大数据征信业务管理问题研究

 二维码 43
发表时间:2016-04-15 13:47作者:郭安娜来源:中国征信

来源:《中国征信》2015年第11期。


作者:郭安娜,高级经济师,现任中国人民银行杭州中心支行副巡视员。


       大数据和征信


       随着信息技术的不断发展,对数据获取、存储、挖掘、处理和分析的能力迅速提升,信息以几何指数形式激增,从而开启了一次重大的时代转型——大数据时代。关于“大数据”目前尚无统一、明确的定义,但关于大数据的特点通常认为可以概括为以下四个方面:一是数据体量巨大;二是数据类型繁多;三是价值密度低;四是数据产生和处理速度快。


       征信是一个专门经营数据的行业。它是指专业化的征信机构,依法采集、整理、保存、加工自然人、法人及其他组织的信用信息,并向在经济活动中有合法需求的信息使用者提供信用信息相关产品和服务,帮助市场主体判断控制风险、进行信用管理的活动。可以看到,征信业发展的基础在于数据,征信业务的各个环节都是围绕数据而开展的。大数据时代的到来,伴随着从数据规模、种类、处理技术、到应用理念等方方面面的变化,使征信业务呈现出许多与传统征信业务不同的新特点。这些特点给征信业的发展带来许多新的机遇的同时,也带来许多新的挑战。如何抓住时代变革,并有效地利用好这个变革,成为征信业发展面临的重要课题。


       大数据征信业务相比传统征信业务的特点


       大数据征信业务的数据来源可以更加广泛


       传统征信业务的数据主要来自线下,以银行信贷数据为主,种类较为单一,覆盖的人群主要为与银行有信贷往来的个人、企业和其他经济组织。而信息技术的发展以及人们对电子化设备依赖程度的提高,使人们的生活轨迹通过技术手段进行有效捕捉成为可能。大量线上数据、非结构化数据呈现在人们眼前,并为人们所用。以首批获批开展个人征信业务准备工作的八家征信机构为例,除拥有强大的内部数据源优势外,一般通过合作商户数据交换、建立联盟、外购数据源、网络公开爬取、用户授权等方式来丰富和扩充自身数据,基本涵盖金融、消费、行为、社交、公共等领域。这些数据通常含有上千甚至上万的维度,并且由于长期的客户积累,覆盖人群也相对较为广泛。


       大数据征信业务的数据处理技术更加复杂


       传统征信业务对数据的处理往往比较简单,例如经过简单的加工整理形成信用报告。而大数据征信业务则不同,主要体现在三个方面。首先,大数据环境下,虽然数据的体量剧增,但价值密度随之降低,因此需要有相应的技术对海量原始数据进行清洗、匹配、归类和实时更新。其次,文本、图片、视频等非结构化数据无法用传统征信业务对数据的处理技术来处理,而这些数据往往蕴含传统数据所没有的价值。最后,也是最重的,即大数据的理念。大数据不仅注重“过去”,更看重“现在”,强调通过成千上万个数据变量实时地反映个体的行为轨迹,从多个维度来刻画该个体的性格、习惯等特征,并以此推断其未来的履约情况,因而许多看似与信用无关的数据可能具有价值。这些机构可以通过专业的数据处理团队和软硬件设施,搭建起符合自身业务需要的云计算服务架构。


       大数据征信业务的产品和服务更加丰富


       传统征信业务的产品主要为信用报告,广泛应用于金融信贷领域。而金融服务有明显的长尾效应,处于尾部的人群由于较难获得理想的金融服务,因而也很难被传统征信所覆盖。大数据技术的发展、电子设备的普及以及信息技术的渗透大大拓宽了征信产品和服务的种类和应用场景。在应用方面,各家机构采取的策略通常是从机构本身所在的生态圈开始,进而通过商户合作、打造联盟等手段逐步拓展,最终致力于能够将自身的产品和服务应用于银行、证券、保险、个体网络借贷(P2P)、众筹、融资租赁、小贷、信托、各种商业往来以及租车、租房、酒店、超市、婚恋、旅游等各类经济、金融和生活场景。相对于传统征信,大数据征信机构的产品和服务更加灵活,也更加贴近生活。


       大数据征信业务管理存在的问题


       信息主体权益保护问题


       虽然,大数据征信业务相比传统征信业务拥有许多新的特点,并为其发展带来一定的优势,但同时也带来许多问题,其中首当其冲的是信息主体权益保护问题。尽管《征信业管理条例》(下称《条例》)中对信息主体、尤其是个人信息主体的权益保护也做了相应的规定,但是具体实施中尚存在诸多不确定性,部分权益无法真正落实。比较突出的如信息采集的范围、信息主体的知情权、同意权等问题。


       首先是信息采集的范围问题。大数据背景下,征信机构面临的信息成千上万,千变万化,对于哪些信息属于信用信息,哪些信息能够采集,哪些信息不能采集没有可参考的标准,从而给征信监管带来一定的困难,主要表现为两个方面。一是征信机构的界定方面,在大数据的理念里,许多信息虽然不直接体现信用,但是能够通过数据挖掘,从另外的角度来反映信用。在这样的理念下,征信机构采集信息的范围被极大地扩大化。根据《条例》,征信业务所针对的是信用信息,但是《条例》却未对信用信息的定义或范围做出说明。现实中,越来越多的机构从事信息相关业务,例如以工商数据为主的公开数据的采集、整理、加工和提供,又如基于网络行为数据的欺诈分析等等,此类机构无法与征信机构相区分,从而增加了市场准入以及后续管理上的难度。二是信息主体权益保护方面,虽然《条例》明确了禁止采集和不得采集的信息范围,但实际操作中仍然存在界定上的困难。例如,部分机构拟采集的来自各种聊天软件、微博、空间、互联网社区、游戏等平台的个人社交和行为信息,可能涉及信息主体隐私。


       其次是信息主体的知情权、同意权问题。知情权是指信息主体知悉、获取信息的自由和权力;同意权是指信息主体对于自身信息被采集、使用拥有同意与否的自由和权利。《条例》中明确了信用信息的采集或提供、使用必须取得信息主体同意,但对于何为“同意”却未做说明。例如在信息采集方面,众多大数据机构大都采取在服务协议中增加条款的方式来告知信息主体并取得信息主体同意,但条款内容往往过于宽泛,且并无明显的标识来提示信息主体协议中包含重要信息内容,信息主体往往忽略协议的存在,或即便浏览了协议内容也并不知晓征信机构何时从何渠道采集了自身的哪些信息,告知和授权实质性作用不强。同样地,在信息使用方面,《条例》对于授权的具体要求,如授权的范围、时限、书面授权包含的形式等情况也未做说明。因此,如何界定信息主体的“同意”以及“同意”具体包含哪些内容,从而来确保信息主体的知情权、同意权,成为征信管理中的突出难题。


       征信产品和服务的质量问题


       传统的信用报告,以客观数据展示为主,信用报告的质量一目了然。大数据背景下,征信机构的产品和服务呈现多样化的发展趋势,并且这些产品和服务往往是基于海量数据和复杂的模型而研发产生的,其过程在很大程度上是一个“黑匣子”,因而对于它的质量的监管就变得相对困难。例如,各家开展个人征信业务准备工作的征信机构拟推出的信用评分产品,监管者或使用者能够了解其评价的关键的几个方面因素,但是对于具体采用的指标及权重的计算却很难掌握,同时这也是征信机构的核心竞争力,因而很难得出其是否合理的结论。另外,不像信用报告,评分本身不体现信息主体的具体信息,因而信息主体无从得知自身的信息是否被正确采集和使用,但在使用过程中会猜测模型的影响因子,因此模型设定的合理性将直接影响信息主体对信用的认识和接下去的行为,不合理的模型设定可能会导致征信产品和服务的社会影响与业务开展初衷的偏离。


      信息安全问题


      由于开放、共享等技术特征,大数据环境下的信息安全问题更为突出。首先,是技术层面。征信机构往往拥有海量数据,数据的大量聚集使得黑客一次成功攻击能够获得更多的收益,无形中降低了黑客的攻击成本,并且信息提供者、信息使用者和征信机构大都是通过互联网来传递数据,这会吸引更多的潜在攻击者,使征信数据成为网络黑客攻击的目标。其次,是管理层面。由于征信机构的数据维度和量级都比较大,如果内控不严、管理不善,比如信息的操作权限、审批流程、数据脱敏等制度缺失,一旦发生泄漏,其影响也较大。而对于一些技术能力有限的征信机构,数据库防护网建设往往依赖外包公司,从而面临更大的道德风险。


       征信业务监管的有效性问题


       大数据背景下,征信机构拥有更多的信息提供者和信息使用者,并且这些信息提供者和信息提供者大都通过互联网或手机通信网络,来实现与征信机构三者之间的联系和数据交换。因此,对于大数据征信业务的监管将面临许多新的困难。一方面不同于传统征信,其规范运行主要通过对信息提供者和信息使用者即金融机构的监管来实现,金融信用信息基础数据库负责提供数据支持;市场化的征信机构本身掌握其业务开展的所有数据,因而存在很大的道德风险。另一方面《条例》虽然对信息提供者的不良告知义务和信息使用者按约定用途使用信用信息的行为进行了约束,但是却并没有赋予监管部门对信息提供者和使用者进行检查的权力,操作上也并不可行。并且,大数据机构的信息提供者和信息使用者不像传统征信那样集中,不仅是机构,甚至可能是遍布全国的个人,因而增加了征信监管的难度。


       市场竞争和信息共享问题


       随着大数据概念的兴起,越来越多的数据拥有者看到了“数据”背后蕴藏的潜力,进而开始涉及包括征信业在内的各种与“数据”相关的领域。各种电商平台、网络公司、支付机构、通信公司、IT公司等纷纷申请设立征信机构。然而数据拥有者并不等同于大数据拥有者,利润的诱惑驱使这些机构盲目进入市场,从而给市场的良性竞争和信息环境的改善带来不利影响。一方面,这些数据拥有者出于竞争的考虑,往往更倾向于自己设立征信机构,而不是将自己的信息提供给其他征信机构,从而导致信息割裂。另一方面,真正拥有大数据技术的机构由于得不到更加全面和丰富的数据,从而使得数据不能被有效的挖掘和使用,造成资源配置效率低下。


       进一步完善征信业务管理的对策建议


       完善制度建设


       首先,要加快出台“个人信息保护”相关法律法规。目前,我国尚无专门针对个人信息保护的法律法规,相关规定主要散见于《消费者权益保护法》、《条例》等制度中。但是随着信息价值的提升,个人信息保护问题也日益突出。因此建议出台专门的“个人信息保护”方面的法律法规,明确个人信息的采集、使用的范围、方式等内容,尤其是对大数据机构更为广泛的信息来源的可采性以及更为多元化的产品的可使用性予以界定。建议对不同性质的信息作适当的分类处理:明确哪些属于可不经授权采集、使用的公开信息;哪些属于必须严格按照要求授权方能采集和使用的信息;哪些属于限制采集和使用的信息。其次,建议尽快出台《条例》实施细则。《条例》虽然对企业和个人征信业务及相关活动进行了规范,但是《条例》属于法规,主要起到框架性、指导性作用,实际操作中,还存在许多不确定性,如对信用信息的界定、两个同意权的监管、业务检查规则、从业人员管理、投诉处理流程等等。


       加强日常监管


       在大数据环境下,对征信机构的数据质量以及征信业务的合规性监管远比对传统征信业务监管困难。因此,除了事中监管之外,更加需要突出事后监管的重要性。对于事中监管,一方面应尽快建立非现场监管框架,制定完善的业务统计监测体系,另一方面应积极探索,丰富现场检查手段,例如通过多方信息的核实比对,提高检查的有效性,加强跨部门沟通,针对征信业务中可能会涉及到的其他行业主管或监管部门,争取支持,开展合作。对于事后监管,应充分运用市场的手段。一方面要求征信机构建立有效的异议处理机制,并重点对征信机构的异议处理的情况进行监督。另一方面作为监管部门,应建立针对市场化征信机构的投诉办理规程,明确投诉办理流程,征信机构、信息提供者、信息使用者各方义务和责任,确保及时有效对投诉进行核实并做出处理。同时,还应将处理情况予以公布,实现市场对征信机构的监督和选择。


       促进行业自律


       当征信市场培育到一定阶段时,应积极促进征信业行业协会的建立和发展。一方面,行业的自我约束可有效弥补法律和行政体系之外缺少的道德约束,并且成本更低、效率更高。相比监管部门,行业协会往往反应更加迅速,处理方式也更加灵活,能够快速协调市场各方主体之间的关系,维护行业的良好声誉。另一方面,行业协会可以作为监管部门实施监管的有效辅助手段。通过制定行业自律公约、建立互相监督机制、开展征信从业人员的职业道德教育、业务培训、资格考试等,来规范行业的执业行为,维护行业公平竞争,同时也有利于促进产品和服务创新,增强市场活力,从而有效引导行业的健康发展。


       加强征信宣传


       目前,我国市场中的信息主体对于自身合法权益的保护意识不强,对相关政策、理论知识也了解甚少,导致在交易过程中常常忽略某些关键的环节或文书,从而使自己处于弱势地位。要发挥好市场监督的作用,首先需要提升市场主体对征信和信用的认识。通过激发信息主体对自身权益保护的意识,反向约束和激励征信机构规范开展征信业务,创新征信产品和服务,提高产品和服务的质量。因此,应在培育和管理征信市场发展的同时,要加大对征信知识的宣传普及和教育,培养信息主体关注自身信用、树立良好信用、维护合法权益的意识,促进良好社会信用文化的形成,发挥市场的自我约束和激励机制。


会员登录
登录
我的资料
留言
回到顶部