泛谈大数据 + AI 在征信行业的应用

一、大数据+ AI的优势

1、更准确的评估用户信用

解释:能够考虑过去可能没有得到信用评分的人,或者可能被传统的基于逻辑回归的评分太匆忙地拒绝了。换句话说,AI可以查看消费者信用记录中的某些数据点,计算他们即将偿还的概率;或者考虑那些过去12个月都没有还款(基于某些原因),但是在某一个数据点,他们偿还了所有的款项的人群。

2、AI对风控的控制更加精确

解释:人为的去做风控,每一个人都会有自己的主观看法和偏差,但是用AI + 模型 + 大数据去判断风险,去控制风险,可以令风险的控制和判断更加精准。

3、极大提升传统征信行业的决策效率

解释:AI对大数据量的加工处理更高效,决策效率也很高,替代了大部分的人工操作和决策过程。

二、AI(以DL为例) 和 ML(以LR为例)在征信大数据上的区别与联系

区别:

1、DL对数据的学习更加全面深刻,而LR过于教条;

解释:DL可以通过复杂的推理,在大数据中找到不明显的东西(优势中的第一点),而往往这些特殊的、或者个别的才最重要;LR则要求我们对数据强行结构化,这种做法容易消磨原始数据的真实性。

2、DL在训练时能够兼顾多个变量之间的交互情况,而LR更多的是考虑单个变量

3、LR对借款人的可解释性更强,DL目前难以提供专业的“原因代码”(据说Equifax公司已经有了一套生成原因代码的算法)。

联系:

1、ML:任何通过数据训练的学习算法的相关研究;

2、DL:深度学习不仅仅是具备多层架构的感知器,而是一系列能够用来构建可组合可微分的体系结构的技术和方法;

3、AI是一个很大的概念,而ML则是AI的一个分支——》ML是AI的子集

4、机器学习包括了ANN(人工神经网络),而ANN是深度学习的起源——》DL是ML的子集;

5、AI == ML + NLP、图像处理、人脸识别、语音识别、知识图谱等

ML == DL + LR、贝叶斯、SVM等

图1 AI、ML、DL的联系

三、大数据+AI技术如何应用到征信行业

大数据 + ML:利用大量用户金融交易行为记录类数据,通过机器学习方法,建立模型,预测用户信用情况,给出不同形式的反馈结果;

大数据 + AI:人工智能补充ML的不足,驱动征信业的发展;

AI可以通过那些手段、方法,补充ML的不足呢?

DNN:深度训练、分析用户信贷类数据,分析多个变量之间的交互;

NLP:智能问答系统、智能机器人解决信贷者的疑问;

图象处理:扫描信贷者的证件;

人脸识别:人脸识别活体,和身份证做对比;

知识图谱:解决反欺诈问题、不一致性验证、团伙欺诈等;

知识图谱应用举例如下:

1)不一致性验证

解释:张三、李四不同公司,但是同一个电话,这就是风险点,但是我们的实名认证没有包括这个信息;

解释:张三和李四是朋友关系,而且张三和借款人也是朋友关系,那我们可以推理出借款人和李四也是朋友关系,而不是父子关系(红包关系链的问题);

2)组团欺诈

解释:张三、李四和王五之间没有直接关系,但通三者之间都共享着某一部分信息,组团欺诈的可能性较高。虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更佳便捷的分析手段。

四、监管(万存知局长)和业界对征信业的看法

1、信用评分——信用模型所用信息不能包括非信贷类(比如某宝所用的特征维度有:学习及职业经历、人脉关系(已经涉及隐私)等,是不可以的!)信息;

2、应用场景——主要在金融领域,特定的用途需要特定的授权;

3、个人征信——三个原则:第三方征信的独立性;征信活动中的公正性;个人信息隐私权益保护;

4、个人征信 ≠ 社会信用体系(个人理解:主要是指应用场景的范围吧,像机场快速通道、谈恋爱等,有点夸张了,也是某宝的主意)。

后记展望

人工智能听起来确实很强大,但是就目前的成果而言,只是提高了人类的工作效率,落实到具体的应用场景,我们还需要更加努力的探索和思考。特别是在金融领域和征信行业,我们更需要投入大量精力,不断尝试,不断创新,积极利用人工智能新技术,新方法,提高工作效率,提升模型精度,提升用户体验。

参考资料:

杨涛. 对人工智能在金融领域应用的思考[J]. 国际金融, 2016(12):24-27.

https://www.americanbanker.com/news/is-ai-making-credit-scores-better-or-more-confusing

http://iof.hexun.com/2016-09-25/186180278.html

http://36kr.com/p/5051729.html

http://www.360doc.com/content/17/0523/09/43402838_656388928.shtml

http://news.mydrivers.com/1/513/513732.htm

http://tech.qq.com/a/20160914/056945.htm

https://www.quora.com/What-is-the-difference-between-artificial-intelligence-machine-learning-data-mining-and-business-intelligence-How-they-are-related

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

Jeff Dean两年AMA全盘点:26个关于谷歌大脑和机器学习未来的问题

AI科技评论按:前两天,谷歌大脑团队又在Reddit上做了一次AMA(Ask me anything)活动。 去年8月时候谷歌大脑团队也在Reddit上做过同样...

33510
来自专栏大数据文摘

CMU机器学习学院院长Tom Mitchell:计算机模拟人脑才刚刚起步

2805
来自专栏AI科技评论

张钹院士:走向真正的人工智能 | CCF-GAIR 2018

6 月 29 日上午,清华大学研究院院长张钹院士为 CCF-GAIR 2018 主会场「AI 前沿技术」做了题为「走向真正的人工智能」(Towards A Re...

1045
来自专栏腾讯研究院的专栏

AI:真实的希望与隐忧

姚  星  腾讯集团副总裁、腾讯AI Lab负责人   过去的二十年是信息高速发展的二十年,它经过了几个发展阶段。从发展的方向上来讲,应该是在上世纪九十年代初期...

1997
来自专栏PPV课数据科学社区

【学习】人工智能\\机器学习\\统计学\\数据挖掘之间有什么区别?

前段时间,作者在 stats.stackexchange.com(译注:国外的一个系列问答网站,其中Stack Overflow是其中一个子站)看到一个...

2568
来自专栏量子位

击败水哥还不算最强,有个人工智能已经通过人类的智商测试了

这几天百度的人工智能在《最强大脑》击败“水哥”王昱珩,再次引发了人们对于人工智能的热议。然而人工智能在人脸识别的比赛中击败水哥,还远远称不上“最强大脑”,因为模...

19610
来自专栏AI研习社

张钹院士:走向真正的人工智能 | CCF-GAIR 2018

AI 研习社按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了宝...

1071
来自专栏全栈数据化营销

数据分析:研究奥迪、宝马、奔驰新能源汽车用户特点与差异

新能源汽车的推广是国家战略。中国新能源汽车市场已经起步,并且发展迅速。国内厂商已经争相争夺新能源车的市场份额。在国内有比亚迪、北汽新能源等引领者,传统上的强势进...

3126
来自专栏数据科学与人工智能

【机器学习】人工智能\\机器学习\\统计学\\数据挖掘之间有什么区别?

前段时间,作者在 stats.stackexchange.com(译注:国外的一个系列问答网站,其中Stack Overflow是其中一个子站)看到一个很有意思...

2305
来自专栏AI科技评论

深度学习理论研究已进入瓶颈期?看看李飞飞们怎么说

AI圈推特红人,Keras框架的作者François Chollet又搞大新闻了!近日François Chollet在推特上发推称:“深度学习研究已经进入了瓶...

33611

扫码关注云+社区