如何用机器学习预测超售,避免美联航“暴力赶客”悲剧

大数据文摘作品,转载要求见文末

作者 | Greg Michaelson

数据机器人实验室(DataRobot Labs)总监

编译团队 | 万如苑,弋心

美联航“暴力赶客”引发全世界媒体口诛笔伐,美联航被迫作出道歉,表示将承担全部责任。而利用机器学习预测,这种悲剧本来可以被避免。

应付不可预测地改变计划的乘客是航空公司面临的许多后勤挑战之一:个人的行程常有意外,而当个人行程累计,飞机上很可能只有一半的乘客。这让航空公司不满,造成了额外的污染,也是美联航等航空公司超售的主要原因。

不幸的是,航空公司处理他们面对的困难时并不总是很优雅,正如美联航“暴力驱客”的故事那样。一个特定的航班被超量预订,没有人想放弃他们的机票来换取航班信用积分。在所有可能的选择中,美国联合航空公司决定强制执法,将一名倒霉的乘客拖下飞机。 这个事件的视频最后被发布到了YouTube上,引发了海啸般的反应。

事实上航空公司的超售有着很好的理由:它具有良好的经济意义。飞机上有多少座位就只销售多少座位不仅不利于企业,而且对环境也不好,对乘客也不利。

上边的漫画说明:很多人想买机票去某些地方。飞机有一百个座位所以只出售100个座位。但是一些人改变了他们的主意。他们被收取高额的改签费用,否则就会失去整张机票。飞机上只有一半的乘客让航空公司不满,造成了额外的污染,也让他们提高了票价。

航空公司应该如何使用大数据?

航空公司依靠大数据,收集有关所有客户及其行为的海量数据和信息。他们知道你什么时候飞,你往哪里飞,你喜欢什么座位,你家在哪里,还有其他更多的信息。航空公司应该(有时确实这么做了)使用数据科学来最大限度地提高您的舒适度,幸福度,最终将盈利最大化。使客户更快乐对企业有利。航空公司应该使用机器学习来解决问题。机器学习只是使用历史数据来构建一个可以对未来事件做出预测的模型。例如,既然我的航空公司过去已经飞了数以千计的班次,我的数据应该告诉我明天航班被超额预定的可能性。

估算不来乘机的人数

也许航空公司要解决的最简单的问题是估算不来乘机的人数。解决这个问题最简单的办法就是把历史上没来乘机的人数统计出来,然后取平均值。更复杂的解决方案可能会随季节调整; 例如,冬季月份可能意味着道路状况会导致更多的乘客缺席。最复杂的方法可能包括分析交通和天气数据以预测取消预定和放弃座位的概率。有趣的是,在过去几年,我见过的超售情况的次数确实有所下降,所以航空公司在这方面的做法可能越来越复杂了。

估计航空公司超售时能提供的福利

即使是最复杂的模型,系统中也总会有一些不可预测性。幸运的是,只有在您找不到愿意乘坐稍后航班的人的情况下,超额预订才会成为一个麻烦。航空公司通常会提供飞行券甚至现金来激励人们乘坐稍后的航班。

然而,在这次事件中,这个方法没有奏效。航空公司可以支付一大笔钱(超过1000美元的现金)给乘客,从而说服他们搭乘稍后的航班。我不能想象那架飞机上没有一个人愿意为了1000美元放弃座位。我的猜测只能是航空公司补偿的不够罢了。

机器学习可以很容易地用于预测愿意以特定的补偿率放弃座位的人数。那么这个优化问题就变得很简单了。

确定需要主管出面的情况

鉴于机场发生的事故数量之多,每个航空公司都应该有一个自动系统,以便在出现某些情况时向主管发出警报。例如,如果登机口的工作人员无法找到超售航班上愿意放弃座位的乘客,则应将信息自动发送给主管。如果乘客已经登上飞机,但其中有些乘客不得不被赶下去,则应立即自动通知主管。

完全免除改签费用

当然,就三大航空公司来说,有足够的数据可以估算出变更航班的人数。 如果任何一家公司收回这项政策——这个政策真的是过去的糟粕——他们就会极大地超越竞争对手。退一万步来说,凭什么不取消超售航班的改签费用?

确定为什么人们不想放弃自己的座位

虽然能够识别那些可能会提供座位的乘客会很有用,但是了解客户为什么这么做会更有价值。这一点数据科学也可以做到。征信机构一直在通知客户为什么他们的信用评级多年来总是下降——主要是通过监管。同样的技术也应该用来帮助航空公司了解客户为什么做出那样的选择。(据我所知,DataRobot是唯一可以使这些原因代码用于所有现成模型的机器学习平台)

随时更新这些模型

航空公司建立的预测模型都不会持续很长时间,因为世界在不断变化。人们会改变,他们的习惯会改变,住所也会改变。这意味着这些模型会比其他类型的模型老化得更快。能够快速地迭代现有的模型进行改进和更新是保持领先的关键。

那么他们为什么不这样做呢?

事实是,做数据科学很困难。因为很难找到同时有数学技巧和编码能力的人,并且他们还要清楚怎么才能做好航空公司业务。不仅如此,商界人士和管理人员也很难在自己的业务中找出利用这项技术真正的商业机会。如果他们不理解,他们就不会优先考虑它,所以也就不会做这件事。我看到这种情况发生在数百家公司里,航空公司也没有什么不同。

自动化才是解决方案

在大多数情况下,手工编码的预测模型是一种过时的建模方法。像DataRobot这样的工具可以让商业分析师像数据科学家一样能够在短时间内顺利地建立预测模型。这意味着积压的项目可以尽快的完成,能够避免上述事故的人工智能将得以建立,而且竞争对手会疑惑究竟哪里出了错。自动化正是每年建立几个模型和每年执行几百个人工智能解决方案的区别所在。它也是把你的客户从飞机上拖下来和把你大笔的钱存到银行之间的区别。

一人一笔 | 数据团队建设“全景报告”

大数据文摘将结合一系列专访和问卷,与清华数据科学研究院联合发布《数据团队建设全景报告》。

在数据驱动时代,不同行业、不同公司处在数据团队建设的哪些阶段?数据团队应该如何运作?

如果你和数据团队一起工作,或者希望了解其他数据团队的发展现状和趋势——

那么请您花费5分钟时间,点击“阅读原文”填写问卷,帮助我们完成这次调研。

你将获得:

*《数据团队建设全景报告》最终完整版;

* 大数据文摘2017年度电子杂志

原文地址: https://www.datarobot.com/blog/did-big-data-cause-united-airlines-to-drag-a-screaming-passenger-off-a-plane/

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-04-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

可伸缩光学电路:机器人表皮的新选择

比利时根特大学(Ghent University)的研究人员们声称采用可弯曲也能伸缩的互连开发出首款光学电路,可望作为发展可穿戴式人体传感器与机器人表皮的理想应...

2095
来自专栏华章科技

英特尔人工智能,助力全球领先云服务供应商

微软Project Brainwave是一个基于FPGA的低延迟深度学习云平台。微软创新地使用了英特尔提供的Stratix10 FPGA,创新的硬件赋予了这一深...

1031
来自专栏VRPinea

强行科普|错过这些性价比极高的VR相机,仿佛损失了一个亿

3247
来自专栏人工智能快报

美NASA投100万美元启动太空机器人挑战赛

2016年8月18日,美国航空航天局(NASA)网站发布消息称,NASA计划投资100万美元启动太空机器人挑战赛。 NASA已经联合休斯顿太空中心、NASA约翰...

3338
来自专栏镁客网

首款带屏智能音箱、前置双摄Pixel 3,这届谷歌发布会有点平淡

10月9日晚上11时,谷歌在美国纽约召开了秋季新品发布会,如意料之中,谷歌发布了新一代智能手机Pixel 3/Pixel 3 XL、平板Pixel Slate,...

942
来自专栏数据和云

基于数据库的PCIe闪存卡解决方案

在2013年底,云和恩墨和LSI公司一起举行了一次媒体发布会,介绍了两家公司在解决方案上的合作。我摘录一下媒体发布的一些内容和我的部分观点,和大家分享。 1.前...

3647
来自专栏腾讯大讲堂的专栏

青少年守护,守护孩子的“好奇心”

暑假期间 很多孩子们除了完成老师布置的家庭作业 就是在网上当个成天冲浪的 “小肥宅” 美好的网络乐趣无穷 ? 然而,没了学校的监管,爸妈的监督 低俗、暴力、沉...

1124
来自专栏速成应用小程序开发平台

生鲜水果店如何借助微信小程序庞大流量来提升店铺营业额

在这么多的生鲜水果店中,要想从中脱颖而出,在留住老顾客的同时还能吸引新顾客,那么就必须要使用眼下最火的门店小程序来维护老顾客,服务新顾客,而且门店小程序的技术相...

2143
来自专栏新智元

六项世界第一!余承东发布7纳米“超级恐怖”芯片,麒麟980让世界颤抖

刚刚,在2018德国IFA展会上,华为消费者BG CEO余承东倾情演绎,终于揭晓了这款举世瞩目的芯片——华为手机旗舰级处理器麒麟980,也兑现了此前放出的豪言:

822
来自专栏AI科技大本营的专栏

华为麒麟 970 发布,超越高通骁龙 835 了吗?

今日(9 月 2 日)晚间,华为在德国 IFA 2017 大会上正式发布了新一代麒麟 970 芯片。 配置 麒麟 970 采用了台积电 10 nm 工艺,包含 ...

3266

扫码关注云+社区

领取腾讯云代金券