ZestFinance用大数据颠覆传统征信业
ZestFinance用大数据颠覆传统征信业
2014-09-05 大数据邦
硅谷越来越多的科技企业开始向金融圈进军。ZestFinance就是其中之一。 这家公司打出的旗号是“将Google算法带入征信领域”,其利用机器学习和大数据技术,创立了一套和传统模式相异的信用评分方式,其中应用的数据变量是传统模式的上百倍。
ZestFinance创立于2010年,创始人道格拉斯·梅里尔(Douglas Merrill)是Google的前信息总监兼工程副总裁,另一位来自金融圈的创始人肖恩·布德(Shawn Budde)曾在第一资本公司(Capital One)负责信贷业务。
记者专访了ZestFinance的创始人梅里尔,他认为,“ZestFinance完全可以取代银行现在用的算法。”
然而,美国个人消费信用评估公司(FICO)中国区总裁陈建表示,这不可能。在美国有1000多家当地信用局为消费者服务,基本隶属于三大征信公司。这三家征信公司分别拥有覆盖全美的数据库,包含超过1.7亿消费者的信用记录。在三大征信公司收集了海量个人征信数据后,还须经过复杂的模型计算才能形成征信产品。这三家征信公司目前使用的计算方法模型都来自同一家公司,即被称为“幕后大佬”的FICO。
越来越多类似ZestFinance的初创公司正在觊觎传统华尔街的地盘。而其势头如同多米诺骨牌,不断推向华尔街的要害。 数据变废为宝
在ZestFinance的官网上有这样一句话:“所有的数据都是信用数据。”这句话恰恰浓缩了ZestFinance所做的工作——将成千上万的数据“变废为宝”,应用于信用评分。
这家公司在短短四年时间内,就先后获得了高达1.2亿美元的融资,其背后的出资人都是著名的IT风投,包括FlyBridge、GRP、LightSpeed以及Matrix等。
目前,美国绝大部分金融机构使用的信用评分都来自FICO的模型算法。自上世纪60年代至今,在美国的征信体系中,FICO的地位从未被撼动。 在美国,经过三大征信公司的整理和FICO的计算评分,海量的征信数据就变成了一份份整齐美观的报告和325-900分值区间的评分,用户可以只买报告,也可以报告+评分打包购买。
中国科学院院士、北京大学教授鄂维南对记者表示,FICO的评分模型的确首屈一指,但并非十全十美。FICO信用评分参考的数据变量只有不到50个,因此很多人摸清了FICO关注的变量后,就可以“模型套利”增加自己的信用评分,例如一个人可以每天反复在图书馆借书还书“刷信用”。
“针对FICO的不足,ZestFinance重新设计了一套信用评估模型。和FICO的不到50条参考变量相比,ZestFinance参考的数据变量多达上万条,并采用非线性化的、更前沿的技术来进行分析,从而防止‘模型套利’的现象,更精准地评估消费者信用风险。”
的确,ZestFinance远远超出了FICO 50条变量的界限。在这个位于洛杉矶的65人团队中,大多是数据科学家,他们开发了多个机器学习分析模型,而在这个模型中使用的数据变量多达上万条。上万条数据变量仅仅是原始信息数据,在这些数据基础上,模型可以得出超过7万个可以判断信贷行为的指标。而模型跑完这些指标仅需要不到3秒钟。
所谓机器学习,是让计算机模拟或实现人类的学习行为,以获取新的知识技能,在数据积累中不断自我完善,可谓是人工智能的核心。ZestFinance的模型之一Hilbert就是成功地将机器学习进行商业应用的案例,让机器承接7万个指标的数据分析工作,寻找逻辑关系,并不断自我改善,人类只需要根据结果进行一些逻辑分析和判断。
“多年来,美国金融机构都在用50条数据变量来决定是否给一个客户授信。问题在于,许多人并没有完整的信用记录,这导致在传统信贷中他们不断吃闭门羹,”梅里尔表示,“在ZestFinance,我们分析上万条数据变量,借助更加广泛的数据,从而对客户的风险预判更加精确。”
数据的类型亦极其广泛:一个人的网页浏览历史、手机付费记录、超市购物清单都可成为重要的参考依据,甚至在用户填写信贷申请表时是使用大写字母还是小写字母,也可以成为数据变量。
“很多数据都可以服务于信贷,例如申请人在我们的网站上停留的时间,就可以反映他对申请贷款的谨慎程度和还款诚意。”梅里尔说。
鄂维南认为,信贷记录属于强变量,在强变量缺失的情况下,可参考多种弱变量,当这些弱变量组合起来,就可形成强变量,服务于信贷风控。“例如,孩子是一个家庭支出的源泉,那么如果能推测出借款人孩子的年龄,就能预测他的消费周期:婴儿有奶粉等固定开销、学生每到9月就要缴纳学费等。只要能避开他的主要支出,就可控制坏账。” 在中国,由于征信业历史较短,缺乏足够的信贷数据,就可以用许多弱变量数据来对一个人进行还款预测。目前,学界有许多人也在进行类似的课题研究。
对于这些“弱变量”的开发利用,陈建亦表示认同,“把数据的价值挖掘出来是不可避免的趋势,大数据发展会越来越日新月异。”但他表示,从互联网数据中挖掘价值,最早做的正是FICO。“银行刷卡交易实时获得数据,通过分析进行风险识别,FICO十几年前就发明了,现在90%以上发达市场的银行都在用FICO这套系统。” 争锋FICO
的确,在当前ZestFinance和FICO尚不能同日而语。FICO占领着美国99%的信用评分市场和绝大部分发达国家的信用评分市场,而ZestFinance目前仅服务过10万名美国人。
在中国,FICO目前拥有80人的团队,已经和15家商业银行、30多家城商行和农商行建立了合作。ZestFinance目前在美国以外的其他地区还没有开展业务,但梅里尔告诉财新记者,目前正与多个中国金融机构洽谈合作。
但从未来发展的空间而言,似乎新生事物总能赢得更多青睐。面对ZestFinance等新型信用评分公司的诞生,美国主流媒体纷纷给予了报道——《经济学人》杂志写道:“ZestFinance比传统评分方法让违约率下降了40%。”CNBC表示:“ZestFinance让无账户人群不再被拒之门外。” 这一切声音,似乎都剑指FICO。
梅里尔表示,ZestFinance采用了和FICO截然不同的技术。FICO是基于20世纪50年代创造的“逻辑回归”模型,那时并无很多可供参考的数据变量。但随着互联网时代来临,数据开始爆发式增长,FICO的评分方式并未改变。梅里尔这位曾经的Google人,则将Google算法引入了征信领域,走在了技术的前沿。“ZestFinance完全可以取代银行现在用的算法。”梅里尔自信道。
对于外界的质疑,FICO表示很冤枉。陈建表示,外界对FICO其实缺乏了解。FICO并非只有一种算法,而是有几百种算法。在美国仅注册的算法专利就多达近200个。在不同的数据场景下,使用的数据变量和数量都不同。 陈建认为,数据变量并非越多越好。
“FICO信用评分的候选变量其实有1000多个,只是具体到每个评分中,只使用其中的几十个变量。”陈建表示,认为变量越多模型越好是幼稚的说法。从统计学角度,模型计算一方面要抓住本质规律,一方面要避免过度拟合。 “变量太多会造成过度拟合的问题。就好比做一双鞋子,与你的脚100%拟合,但别人都不能穿。FICO不是给一个人做一双鞋,而是要给全社会使用。如果一些变量不是适用于每个人,就不适合放在模型中。”陈建说。
根据惠誉评级公司的研究结果,FICO分数的影响力正在下降。现在美国各个银行都有自己的模型,他们会用自己的模型去跑征信原始数据,FICO评分只是其中一个参考变量。例如美联银行(Wachovia)对FICO评分的参 …… 此处隐藏:4231字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [基础教育]2016-2022年中国钢芯铝绞线市场现状调
- [基础教育]语文部编版初一语文下册练习题 句式变
- [基础教育]南京继续教育参考答案--深入学习贯彻习
- [基础教育]国旗下讲话稿——珍惜时间好读书
- [基础教育]北师大版六年级数学下册圆锥的体积教学
- [基础教育]人教版-音乐-四年级下册-四年级下册音
- [基础教育]乔布斯2019年斯坦福大学毕业典礼致辞.d
- [基础教育]2015年加油站安全知识竞赛试题及答案
- [基础教育]2020年教师年度考核个人工作总结
- [基础教育]2019年中考历史试题-2019年大庆市初中
- [基础教育]初三仁爱英语第一轮总复习教案
- [基础教育]SG-A094电气配管安装工程隐蔽验收记录
- [基础教育]冀教版小学数学三年级下册第六单元教材
- [基础教育]青岛版(五制)小学科学二年级下册16《制
- [基础教育]2018-2019年初中科学初一中考真卷测试
- [基础教育]幼儿园大班期末简短评语精选
- [基础教育]2018云南临沧公务员考试申论技巧:这样
- [基础教育]学校食堂经营管理方案
- [基础教育]新中国砥砺奋进的七十年原文
- [基础教育]真空泵的选型及常用计算公式
- 高职田径课程教学现状与对策
- 全髋关节置换术在老年股骨颈骨折患者中
- 青人社厅函〔2016〕576号(附件)工资
- cp101-07砂子检验作业指导书 - secret
- 微观经济学 第八章 博弈论 习题
- 2014高考真题(词语运用)汇编及答案
- 2018年人教版七年级语文下册《第三单元
- 苏教版数学四年级上册第一单元试题 - M
- 四川大学新闻与传播考研2000-2010年真
- 浙江万里学院英语专业四年制本科教学计
- 最新2018马年事业祝福语-范文word版(2
- 最全模具行业术语英文翻译
- 皮亚杰的发展心理学理论
- 64篇高考情景式默写 练习题及答案
- 仿写(学生稿)
- 《SQL Server数据库技术》试卷A
- 第七章作业答案
- 江苏省赣榆县海头高级中学高中语文必修
- 浙江省2001年10月自考正常人体解剖学答
- 2012英语重点短语




