首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告

摘要:此报告首先将dataset进行数据清洗,得到dataset_new。再将dataset_new中属性分为基本信息、贷款行为/意愿信息和征信信息三类,并逐一进行分析。在对基本信息的分析中得出,在贷款未结清者中,青年群体、中等教育程度群体、中等和高收入群体的频数较高,同时已婚、受薪雇员占比高于未婚、个体经营者。在对贷款意愿与行为的信息分析中得出,贷款意愿与行为的变化与是否能够在规定时间内结清贷款相关性较低。在对征信信息的分析中可以得出,征信信息中的正指标与负指标与是否能按期结清贷款有较为显著的正相关与负相关关系。最后再利用机器学习算法训练预测是否能够按期结清贷款的模型,测试结果准确度较高。

00

【应用】揭秘互联网金融的大数据风控

大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。 金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、P2P、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。 传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个纬度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据纬度为十个左右,包含年龄、职业、收入、学历

04

学界 | 伯克利最新研究:用算法解决算法偏差?公平机器学习的延迟影响

大数据文摘作品 编译:小鱼 在一些敏感领域使用机器学习,算法的公平性常会引发巨大争议。 近期频频登上头条的几项研究大多如此:比如利用算法识别犯罪团伙或者,利用图像识别判定同性恋。 这些问题的出现往往是因为历史数据中的偏差特征,比如种族和性别上的小众团体,往往因此在机器学习预测中产生不利的歧视结果。在包括贷款,招聘,刑事司法和广告在内的各种广泛使用AI的领域,机器学习因其预测误差伤害到了历史上弱势群体,而广受诟病。 本月,在瑞典斯德哥尔摩举行的第35届机器学习国际会议上,伯克利AI研究协会发布了一篇论文,来试

02

在P2P市场中代替“看不见的手”的算法在哪里?

首先,我们回顾一些基本定义与假设。P2P市场为“网络借贷是指个体和个体之间通过互联网平台实现的直接借贷。”[2]利率决定一般是平台决定借款利率或者贷款人自主决定,这里我们假设是贷款人自主决定。网络借贷信息中介机构“以互联网为主要渠道,为借款人与出借人(即贷款人)实现直接借贷提供信息搜集、信息公布、资信评估、信息交互、借贷撮合等服务。”[2]作用是降低信息不对称,减少成本。另外,也假设不存在增信与担保等外部因素影响借款人贷款人行为。当然“禁止向出借人提供担保或者承诺保本保息”[2],“不得提供增信服务”[2]也是监管要求。

03

【金融数据】消费金融:大数据风控那点事?

大数据风控同传统风控在本质上没有区别,主要区别在于风控模型数据输入的纬度和数据关联性分析。据统计,目前银行传统的风控模型对市场上70%的客户是有效的,但是对另外30%的用户,其风控模型有效性将大打折扣。 大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制,用户行为数据可以作为另外的30%客户风控的有效补充。大数据风险控制的作用就是从原来被拒绝的贷款用户中找到合格用户,识别出已经通过审核的高风险客户和欺诈客户。 一、银行信用风险控制的原理 金融行业中,银行是对信用风险依赖最强的一个主体,银行本质

05
领券