信而富首席战略官王峻:预先筛选机制可以预防欺诈

发布于:2017-8-1 16:20 135人参与


9月22日,2016中国消费金融高峰论坛北京富力万丽酒店正式开幕。本次论坛以消费金融的发展、创新合作为主题,聚集消费金融业内大咖在22、23日两天内展开讨论和研究。信而富首席战略官王峻发表演讲。   

对于目前征信的现状,王峻分享了两个问题:首先是传统征信数据覆盖率不足,其次网络客户申请中还存在着大量的欺诈。王峻表示,对于消费金融而言,不仅可以采用实时管理性审批额方式,也可以采用预先筛选机制进行筛选。 

王峻认为,在进行消费信贷的过程中,一定要确认客户的还款能力、还款意愿和稳定性,把弱相关的变量综合考虑就会告诉我们很多东西。 

700; color: rgb(47, 47, 47); font-family: "lucida grande", "lucida sans unicode", lucida, helvetica, "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-size: 16px; background-color: rgb(255, 255, 255);">以下为发言原文: 

王峻:非常容幸到这个论坛分享信而富公司对科技的应用,前面两位嘉宾都谈到中国的现状传统的征信体系覆盖不足。今天分享两个问题:一个是传统的征信数据覆盖率非常低,第二就是网络客户申请中存在的大量欺诈。这个数据是基于央行征信局2015年10月的报告,中国14亿人口中有征信记录的人是3亿,真正有征信数据的有2.7-2.8亿人,下面这个客群差不多有5亿左右,因为有社保基金有识别信息,如果调征信报告会调出来一张白单因为没有传统的信贷信息。更多的人群不在体系范围内,包括了未成年人和老年人,有很多在工作年龄的人在最后的5.3亿里面。这是中国的传统征信体系的现状。 

我对美国的市场比较了解,它的征信覆盖非常的完善,是基于FICO评分的系统,在有收入年龄的人群里面覆盖率非常高,在FICO里面它是非常完善的金字塔。在这样一个金字塔下第一个跟中国相比有比较全的征信的覆盖,还有很重要的数据就是美国监管给金融机构定价权,它基于风险偏好进行定价,只要不突破峰顶可以自由定价。在美国运通卡只做最好的人群,它的信用卡利率非常低的,很不好的人也不是没有金融机构覆盖,但是覆盖你的话受的费率可能会高,给你的信用卡每年要收几百美金的年费。这是中美很大的区别! 

还有一个区别就是欺诈的问题,传统的信用金融机构的理解,你的坏账主要来源是指逾期和坏账,在美国它跟失业率和经济周期非常相关,经济下行失业率上升那么坏账率会上升。中国坏账很大一块来自于欺诈,在申请过程中有着身份欺诈银行流水作假等等,有的平台自己报道欺诈占坏账60%以上,我们必须考虑如何应对欺诈的风险。 

简单介绍一下信而富公司,我们的创始人王征宇博士2001年回国,当时中国没有信用卡业务,从10年开始中国转型进入P2P业务,我们通过手机小额短期,我们的客群比较年轻。我们对目标客群有一个清晰定位叫“爱码族”,就是一个成长中新兴一族手机控,一直用手机上网社交消费等等,他们会留下大量的足迹可供我们分析,职业教育程度是职校大专本科数量不是很庞大,他们一般不会再央行系统里面有他们的征信报告,一般来说没有房和车,去小贷公司不会拿到贷款,这是我们的目标客群。 

这个客群有稳定的收入,在央行里面有稳定身份信息的记载,但是他们有很高的消费需求,跟父母年代不同,他们的消费习惯接受是先消费后还款。怎么样在传统征信信息缺失的情况下对他们的信用进行判断,我们在移动互联网的环境下留下的诸多足迹进行分析。信而富跟大的互联网平台包括社交电商包括搜索进行合作,采集爱码族留下的数码足迹,在虚拟空间留下的足迹做的搜索社交群里面的人一度、二度关系,如果知道手机通讯录或者QQ群里面有很多人是老赖那么他是老赖的几率就会高很多。“一个人手机号码十年不变”证明这个人信用良好,同样这个对移动互联网信用分析也很好用。手机端你要填很多的信息,但是有足够样本量的时候就可以分析填写的速度有多快,选择贷款额度从一千到一万你这个手指滑动速度有多快多慢,这些都跟分析你最终是否是坏账相关。这些细微东西每一个不足以强到回答我们在信贷中必须回答的三个问题:还款能力、还款意愿和稳定性,我们把弱相关的变量综合考虑就会告诉我们很多东西。如果能调到一个人多少张信用卡,它的还款历史,它的房贷车贷,那么这些都是非常强相关的信息,所有的这些途径互联网的数码足迹提供的弱相关的数据,它会给你一个方向。我们用到这么多东西说白了是逼出来的,因为中国的征信系统覆盖率非常低,但是通过这样的东西,国内先进的机构分析处理这样数据的能力比美国机构要强,因为美国被Fico系统宠坏了。 

我们有了大量的互联网数据之后,那么是否数据越多越好?传统的统计学分析是用逻辑回归模型,它把几个变量进去预测一个Y的变量,但是这个模型有一个局限放进去的变量不能太多,一般10个以下,10-20之间就是它的局限,20以上这个模型就无法用了。但是在互联网情景下变量是成百上千,再把衍生变量算进去这个变量无限大,你无法用传统的模型进行分析,这时候大家就会听到机器学习。机器学习是在海量数据上形成它的逻辑和判断,它里面有很多具体的技术。 

我讲一个经典的用技术学习机器学习来进行判断和传统的Fico评分系统进行的比较,这是麻省理工学院做的经典研究。上面这图是用传统的Fico评分进行分析,绿色的就是帐期正常,Fico评分高780-800分都是绿色的,下面是用机器学习对更大数据量进行分析,大家看到也不错,高的这边也是绿色,低的这边是红色。但是如果你把两种评估方式进行对比,尤其采用二维空间对比的办法就会发现有一定的区别。这个图我讲解一下:它的横轴是传统的Fico信用评分,绿色比较多,左边是低的,证明它是传统评分信用比较差,竖轴是机器学习,零是最高点,机器学习100是差的,右下角Fico评分和机器学习都认为这个人很好基本上都是绿色的,左上角两者都认为这个人是坏的,都是红色没有问题,但是比较有趣的是左下角传统Fico评分体系下被认为是坏的,通过机器学习发现这些人其实是好的,用逾期率证明它表现非常好。传统的Fico评分有一些局限,在美国有一些西班牙人在银行不太有借款,但是这个人的还款意愿还款能力甚至收入都很好。意思说就是机器学习不是替代了Fico,但是如果两种综合一起进行评估模型预测的精准度增加很多。 

下面讲一下欺诈,我们公司采用了一种预先筛选机制,实时申请就意味着你要申请人提供信息和材料,他知道他要准备什么,预先筛选因为我要筛选的变量跟逻辑模型是我自己知道的,在筛选人不知道的情况下我进行分析,在某一个平台上对于互联网平台上的用户帐龄,活跃度关联人的关系,我进行分析之后5000人的平台有2000万进行放贷,这2000人是我预筛选它就不存在作假的机会,它可以很大程度降低欺诈风险,这样模式未必适用于所有的消费金融场景。我们去年做了比较大规模的测试,开放申请和预先筛选模式的表现的差异。两者差别非常大,逾期率有20%的差别,我们作为一种可能的模式也向大家推荐,是否在时时申请开放申请的情况下也进行预先筛选,进行有效风控。谢谢! 
netease 
我来说两句 0人跟贴 | 135人参与 | 手机发跟贴 |注册
文明上网,请登录发贴

网友评论仅供其表达个人看法,并不表明晋中之窗网立场。