首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据助力顺风车合乘安全

近日,某滴的顺风车服务为了评估夜间顺风车合乘双方安全保障可行性,暂停接受22点-6点期间出发的订单。笔者对“评估合乘双方安全保障可行性”产生了兴趣,参考其他行业的账户风控建模经验,笔者尝试用大数据助力顺风车合乘安全。

由于未获取实际数据,本文将主要介绍模型的需求和应用场景,以及建模的主要步骤和大致思路。

1模型需求

利用数据挖掘辅助风险管理,首先要进行业务诊断,找到业务痛点。笔者经过网络评论归纳、产品流程体验,以及新旧产品规则比对,发现新版顺风车的四项调整措施均有利弊:

新版顺风车从多个方面增强了安全保障,但难免存在“一刀切”的倾向,可能挫伤部分车主的积极性,有碍公司与车主的客户关系,进而影响合乘资源的充分供应。这些措施是及时而必要的事件应对,但是探索精细化风控,识别并应对危害乘车安全的账户及其行为,才是更有利于业务长期健康发展的选项。

如何避免“一刀切”?顺风车账户数量庞大,订单时间、地点、路程、时长、金额等要素波动较大,业务场景不胜枚举,难以依赖专家经验,设定规则识别不安全订单。此外,用户可能通过试错等途径了解部分规则,规避风控策略。这就是数据挖掘在风险管理中一显身手的好时机:挖掘数据隐藏信息,识别可能异常账户,对各类客户应用不同的风控策略,进行相对精准的防范和打击。

具体到本文案例,模型需求概括为:在按图中所示的各项考虑恢复顺风车夜间运营的前提下,结合数据分析,通过机器学习识别可能危害合乘安全的账户。

2模型建立

建模过程大致如下图所示:数据采集和抽取是建模的基础,数据预处理是进行建模的前提(需要耗费较多的时间和精力),探索性数据分析是清晰建模思路的准备,特征工程是影响模型效果的关键。从选择有代表性的特征,到数据建模、模型验证及评价、模型调试并确定最终模型,是一个反复迭代、逐步优化的过程。

在特征工程中,需要发现对因变量y有明显影响作用的特征作为自变量x,以获取更好的训练数据。如果特征提取和特征选择做得好,使用相对简化的算法也容易得到较好的效果,进而降低开发、部署和运行成本,并且提高处理效率。

本文案例中,模型目标是识别危害合乘安全的顺风车车主,可将被投诉且核实为侵害乘客安全(例如暴力、骚扰)的车主账户作为有标记的样本。笔者阅读网络评论发现,当前对于部分与安全相关的乘客投诉的处理方式仅为扣除车主账户的“信任值”和补偿代金券,对车主的影响比较间接,难以充分满足客户对于打击不安全车主的诉求。因此,可以考虑通过文本挖掘从APP的反馈建议模块,以及人工客服投诉记录中挖掘标记样本和部分特征,加入顺风车安全保障模型。

结合业务场景提取特征,例如订单要素(时间、地点、路程、时长、金额)及其波动,车主接单的乘客性别比例,车主因人车信息与订单信息不一致而被投诉的次数,车主因未经乘客同意偏离导航路线而被投诉的次数,车主因要求乘客提前结单并私下结算而被投诉的次数,在原评论功能中发送不雅评论的次数。

参考笔者在其他行业账户风控建模项目的经验,顺风车安全保障模型可以选择有监督分类模型,例如逻辑斯蒂回归、支持向量机、随机森林算法,根据效果和稳定性选择适用于本例的方案。由于本例中有标记和无标记的样本量比较不平衡,需要做平衡处理。

3模型应用

通过机器学习识别出可能危害合乘安全的账户之后,需要制定策略来应对与模型目标相关的风险事件,加强预防性控制。

本文案例中,结合模型结果对车主和乘客进行夜间合乘安全风险评估。注册时长或已完成订单数量小于阈值的车主评估为中风险等级;其余车主根据模型结果,历史投诉记录标记的样本为高风险车主,模型标记的样本为中风险车主,模型未标记的样本为低风险车主。

乘客方面,相对高风险等级的是历史投诉记录标记样本对应的乘客,以及在评论功能中相貌身材类标签数量及次数较多的乘客(参考原评论功能的历史记录和开放评论功能后的审核屏蔽记录);其余乘客的风险等级相对较低。

应用以上评估,对22时至6时之间的夜间订单分类应对。结合各区域的人口密度、建筑物密度、夜间时段的订单数量等因素将订单地点分为偏僻或非偏僻,并应用以下策略:

和模型建立相同,模型应用是一个逐步探索,循序渐进的过程,需要经过试点选择、试点应用、试点反馈、模型调优,才能推广应用。

4总结

本文介绍了运用机器学习识别可能危害合乘安全的顺风车账户,并由此设计了针对夜间顺风车订单的风控策略,建模需求从业务中来,建模应用到业务中去。一个业务痛点的解决需要从许多方面进行梳理和调整,要想加强精细化管理,减少“一刀切”,大数据的丰富信息不容小视。

- END -

团队介绍:我们是毕马威旗下的专业数据挖掘团队,微信公众号(kpmgbigdata)每周六晚8点准时推送一篇原创数据科学文章。我们的作品都由项目经验丰富的博士或资深顾问精心准备,分享结合实际业务的理论应用和心得体会。欢迎大家关注我们的微信公众号,关注原创数据挖掘精品文章;您也可以在公众号中直接发送想说的话,与我们联系交流。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180609G1G47200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券