泛谈大数据 + AI 在征信行业的应用

一、大数据+ AI的优势

1、更准确的评估用户信用

解释:能够考虑过去可能没有得到信用评分的人,或者可能被传统的基于逻辑回归的评分太匆忙地拒绝了。换句话说,AI可以查看消费者信用记录中的某些数据点,计算他们即将偿还的概率;或者考虑那些过去12个月都没有还款(基于某些原因),但是在某一个数据点,他们偿还了所有的款项的人群。

2、AI对风控的控制更加精确

解释:人为的去做风控,每一个人都会有自己的主观看法和偏差,但是用AI + 模型 + 大数据去判断风险,去控制风险,可以令风险的控制和判断更加精准。

3、极大提升传统征信行业的决策效率

解释:AI对大数据量的加工处理更高效,决策效率也很高,替代了大部分的人工操作和决策过程。

二、AI(以DL为例) 和 ML(以LR为例)在征信大数据上的区别与联系

区别:

1、DL对数据的学习更加全面深刻,而LR过于教条;

解释:DL可以通过复杂的推理,在大数据中找到不明显的东西(优势中的第一点),而往往这些特殊的、或者个别的才最重要;LR则要求我们对数据强行结构化,这种做法容易消磨原始数据的真实性。

2、DL在训练时能够兼顾多个变量之间的交互情况,而LR更多的是考虑单个变量

3、LR对借款人的可解释性更强,DL目前难以提供专业的“原因代码”(据说Equifax公司已经有了一套生成原因代码的算法)。

联系:

1、ML:任何通过数据训练的学习算法的相关研究;

2、DL:深度学习不仅仅是具备多层架构的感知器,而是一系列能够用来构建可组合可微分的体系结构的技术和方法;

3、AI是一个很大的概念,而ML则是AI的一个分支——》ML是AI的子集

4、机器学习包括了ANN(人工神经网络),而ANN是深度学习的起源——》DL是ML的子集;

5、AI == ML + NLP、图像处理、人脸识别、语音识别、知识图谱等

ML == DL + LR、贝叶斯、SVM等

图1 AI、ML、DL的联系

三、大数据+AI技术如何应用到征信行业

大数据 + ML:利用大量用户金融交易行为记录类数据,通过机器学习方法,建立模型,预测用户信用情况,给出不同形式的反馈结果;

大数据 + AI:人工智能补充ML的不足,驱动征信业的发展;

AI可以通过那些手段、方法,补充ML的不足呢?

DNN:深度训练、分析用户信贷类数据,分析多个变量之间的交互;

NLP:智能问答系统、智能机器人解决信贷者的疑问;

图象处理:扫描信贷者的证件;

人脸识别:人脸识别活体,和身份证做对比;

知识图谱:解决反欺诈问题、不一致性验证、团伙欺诈等;

知识图谱应用举例如下:

1)不一致性验证

解释:张三、李四不同公司,但是同一个电话,这就是风险点,但是我们的实名认证没有包括这个信息;

解释:张三和李四是朋友关系,而且张三和借款人也是朋友关系,那我们可以推理出借款人和李四也是朋友关系,而不是父子关系(红包关系链的问题);

2)组团欺诈

解释:张三、李四和王五之间没有直接关系,但通三者之间都共享着某一部分信息,组团欺诈的可能性较高。虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更佳便捷的分析手段。

四、监管(万存知局长)和业界对征信业的看法

1、信用评分——信用模型所用信息不能包括非信贷类(比如某宝所用的特征维度有:学习及职业经历、人脉关系(已经涉及隐私)等,是不可以的!)信息;

2、应用场景——主要在金融领域,特定的用途需要特定的授权;

3、个人征信——三个原则:第三方征信的独立性;征信活动中的公正性;个人信息隐私权益保护;

4、个人征信 ≠ 社会信用体系(个人理解:主要是指应用场景的范围吧,像机场快速通道、谈恋爱等,有点夸张了,也是某宝的主意)。

后记展望

人工智能听起来确实很强大,但是就目前的成果而言,只是提高了人类的工作效率,落实到具体的应用场景,我们还需要更加努力的探索和思考。特别是在金融领域和征信行业,我们更需要投入大量精力,不断尝试,不断创新,积极利用人工智能新技术,新方法,提高工作效率,提升模型精度,提升用户体验。

参考资料:

杨涛. 对人工智能在金融领域应用的思考[J]. 国际金融, 2016(12):24-27.

https://www.americanbanker.com/news/is-ai-making-credit-scores-better-or-more-confusing

http://iof.hexun.com/2016-09-25/186180278.html

http://36kr.com/p/5051729.html

http://www.360doc.com/content/17/0523/09/43402838_656388928.shtml

http://news.mydrivers.com/1/513/513732.htm

http://tech.qq.com/a/20160914/056945.htm

https://www.quora.com/What-is-the-difference-between-artificial-intelligence-machine-learning-data-mining-and-business-intelligence-How-they-are-related

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

AI要抢“人类”饭碗?有道新推的人机翻译告诉你协作才能共赢

1284
来自专栏悦思悦读

制定「机器学习」学习计划【3】

IT 行业发展迅速,各种新名词此起彼伏。身处这样一个热点行业,学习是必须的。 大数据、AI(人工智能)相继席卷世界后,作为程序员,真得学点机器学习了。具体为什么...

2736

探讨一些在机器学习上对你有影响的问题

在自学机器学习上,一般人很难保持足够的动力持续下去。标准的测试数据往往是非常枯燥的,并且可能与你和你的日常生活毫不相干,甚至可以说是无聊至极。在你看来,你想要的...

19310
来自专栏华章科技

2018上半年这10本新书,技术大牛们都在追着看

不知你的上半年都有哪些收获?上半年只收获了8斤体重的数据叔惶恐地抄下了郑州地铁上看到的名言警句:

663
来自专栏量子位

Facebook的AI意外发明了自己的语言,到底这是怎么回事?

李杉 编译整理 量子位 报道 | 公众号 QbitAI Facebook人工智能研究实验室里,最近出现了一些神奇的对话。比如说: Bob: i can i i ...

3357
来自专栏全栈数据化营销

3个案例说决策树应用:提高数十倍效率,还能帮你精准找到另一半

一个单身狗写下这个标题我是心虚!!! 很早就听说过决策树算法的威力,很早之前就做过决策树模型的分析和应用,这次就来看看决策树算法的操作和实际运用。 首先,要先理...

9928
来自专栏数据科学与人工智能

人工智能/机器学习知多少?

从在智力竞赛节目和围棋人机大战战胜人类,到推送广告时表现出种族偏见而备受抨击,我们似乎已经进入了人工智能发展步伐迅速加快的时代。但就目前而言,我们还无法让机器具...

3206
来自专栏量子位

再谈量子计算机:中国队有何突破;基本原理是什么,又长什么样

唐旭 安妮 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 继续谈谈量子计算。 昨天,中科院召开发布会正式宣布:“世界首台超越早期经典计算机的光量子...

3288
来自专栏大数据文摘

为何机器学习识别声音还做不到像识别图片那么容易?

1724
来自专栏灯塔大数据

深度|大数据时代的“因果关系”思辨:相关性和因果性

迈尔舍恩伯格在《大数据时代》里说,“要相关,不要因果”,在大数据时代,有相关,就够了。而周涛则在《为数据而生》一书中说,放弃对因果关系的追寻,就是人类的自我堕...

3035

扫码关注云+社区