前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Airbnb定价算法揭密

Airbnb定价算法揭密

作者头像
花落花飞去
发布2018-02-02 11:00:34
4.6K0
发布2018-02-02 11:00:34
举报
文章被收录于专栏:人工智能人工智能
照片:The Voorhees
照片:The Voorhees

你应该收多少钱才会让一个人住在你家里?或者说,你愿意花多少钱住在别人的房子里?对于计划好的假期和突然决定的行程,你是否愿意或多或少地花点钱?

回答这些问题并不容易。我和我的同事们发现,这种定价的困难阻止了潜在的房源出现在我们的网站——Airbnb上。Airbnb这家公司将空闲的房间,公寓和房屋与想预订的人相匹配。

在所观察的人群中,我们看到人们经历了在我们的网站上列出他们的财产的过程,但是当涉及价格问题时都会犹豫不决。许多人会看看他们的周围地段的价格,并选择一个差不多的价格, 这涉及到在浏览器中打开很多标签,并找出哪房子与他们的类似。有些人在登陆前有一个目标价位,可能是想赚点钱来减轻按揭的压力或抵消度假的费用。所以他们设定了一个价格,来帮助他们实现这个目标,而没有考虑真正的市场价值。而不幸的是,有些人放弃了进行定价。

很明显,Airbnb需要为用户提供更好的方式,如自动化价格信息资源,来帮助房主做出决定。这就是为什么我们在2012年开始构建定价工具,并且一直在努力使它们变得更好的原因。今年六月,我们发布了最新的改进版本。我们开始进行动态定价,即根据市场变化情况,每天提供新的价格提示。我们调整了常用的定价算法,并开始加入一些不寻常的,甚至令人惊讶的房子特点。而且我们增加了一种我们认为独特的机器学习方法,因此,我们的系统不仅可以从自己的经验中学习,还可以在必要时使用一点人类的直觉。

照片:The Voorhees
照片:The Voorhees

在线上,许多公司使用算法来设置或建议价格。例如,eBay会告诉你同类产品的销售价格,并根据这些信息选择价格。eBay的定价问题相对来说比较简单,不管卖方和买方在哪里,或者你是在今天还是下周销售产品,价格都差不多。然而,对于UberLyft,位置和时间都很重要,但这两家公司只是依照法令来设定价格,用户没有选择价格的权利,也不需要知道价格的制定是否透明。

在Airbnb,我们遇到了一个异常复杂的问题。我们网站上的房子超过一百万栋,每一栋房子都是独一无二的,各有各的的地址,面积和装饰。我们的房主对礼宾者,厨师或导游的要求也各不相同。一些有规律的事物,如季节性的天气变化;不常见的事情,比如当地的大型活动,让问题更加复杂。

三年前,我们开始建立一个工具,为潜在的主机提供价格提示。这个工具根据房源的最重要的特点进行定价,如房间和床位数量,房子的位置,以及某些附近的设施,如停车场,甚至游泳池。我们在2013年推出了这个工具,并且大部分情况下都表现很好。但是它有局限性。首先,其价格设定算法的工作方式不会改变。如果我们明确地设定地点是俄勒冈州波特兰市的珍珠区,并且岸边的房子比离河流一个街区以外的房子贵得多,这个算法会永远使用这些指标,除非我们手动的去改变它们。而且我们的定价工具不是动态的,价格提示不会根据订房时间和同时也在订房的人数来调整。

从2014年年中开始,我们一直在试图改变这一点。我们想要建立一个从错误中学习,并通过与用户进行交互来改进自己的工具。我们也希望这个工具可以根据需求进行调整,并在必要时根据需求调整提示价格,在房源多时降低价格,在需求多时提高价格。我们已经开始弄清楚了,并在六月份,开始让我们的房主使用这个新工具。我们会告诉你这些工具是如何演变的以及它们现在的工作方式。我们还会告诉你为什么我们认为我们的最新工具Aerosolve最终将不仅仅解决房源定价问题,而这就是为什么我们将其发布到开源社区的原因。

照片:Airbnb(3)
照片:Airbnb(3)

全球范围内: Airbnb的定价工具可以应用于许多不同国家的各种房子,从上到下,包括伦敦的蒙古包,爱尔兰的城堡和夏威夷的树屋。7月份进行快速抽查的时候,房主的定价分别为:城堡的双人单间147美元,蒙古包里四个人睡两张床159美元,容纳两个人的树屋275美元。

要了解我们遇到的问题,请考虑以下三种不同的情况。

假设在上一届足球世界杯期间,你曾经住在巴西。你的家乡将会迎来来自世界各地的大量旅客,他们将要来观看这个星球上最大的足球比赛。而你的房子里有一个空余的房间,你想和其他足球爱好者交朋友,并顺带赚一些钱。

使用我们的工具来帮助您找出价格,有几个因素需要考虑。首先,这是一个在该国家几十年一次的事件,所以在Airbnb上显然没有任何历史数据可以借鉴。其次,每家酒店都被没有空房,因此供求关系明显失衡。第三,游客已经为他们的门票和国际旅行付出了巨额的款项,所以他们可能已经为住房也准备了不少钱。除了房间面积,房间数量和位置这些显而易见的参数之外,还必须考虑所有这些因素。

或者假设你继承了苏格兰高地上的一座城堡,为了支付清洁护城河,运作酒窖和喂食猎鹰的费用,你决定把炮塔改成民宿。与世界杯的情况不同,这时你可以以附近城堡的类似数据为根据来定价。其中一些数据可能会跨越多年,并提供有关旅游季节性的信息。而且你知道,因为该地区还有很多其他的民宿可选,所以现在旅游房间的供应和需求是非常平衡的。然而,这是苏格兰唯一一个设有双护城河的特殊城堡。那么一个系统该如何计算这个罕见又独特的功能的价值呢?

作为最后一个例子,假设你在巴黎拥有一间典型的两居室公寓。你将在接下来的几个星期里度过八月份的假期并向南前往蒙彼利埃。因为有许多类似的房源,所以定价相对容易。但是,在你收到第一笔租房后的款项之后,你决定逐步增加价格,以尽量增加收入。这是一个棘手的问题——如果价格太高了,或者太靠近预订日期,将会失去赚钱的机会。也可能恰恰相反:您第一次以较低的价格出租了房子,那么在接下来的几个月你都很可能以相同的价格租出,希望你敢于承担风险。我们该如何帮助房主获得更好的信息来避免这种不确定性和遗憾?

这些都是我们面临的问题。我们希望构建一个易于使用的工具来为房主提供有用的信息,这有助于他们决定自己房间的收费,同时明确给出提示价格理由。

我们的工具的整体架构非常简单明了:当一个新的房主开始为我们的网站添加一个房源时,我们的系统将提取该房源的关键属性,并在该地区查找其他具有相同或相似属性的房源,找到那些被成功预订的,并兼顾需求和季节性的因素,最终从中间价位进行提示。

对我们来说,最棘手的问题弄清一个房源的关键属性究竟是什么。由于我们网站上所有房子的设计和布局都是不同的,而且城市里的各个地段都有房子出现在我们网站上,不仅仅有公寓和住房,还有城堡和冰屋。于是我们决定我们的工具将使用三种主要类型的数据来设置价格:相似性,新近度和位置。

关于相似性的数据,我们从所知道的所有关于房源的量化属性开始,然后查看哪个属性与客户支付的价格最相关。我们得到的属性有容纳人数,整体或部分出租,房子类型(公寓,城堡,蒙古包),和评论的数量。

也许这里最令人惊讶的属性是评论的数量。事实证明,人们愿意为评论多的房子支付溢价。尽管亚马逊,eBay等公司依靠评论来帮助用户选择买什么或者从谁那里购买,但评论的数量对价格的影响并不明显。对我们来说,即使只有一个评价也能对网站上的房子产生巨大的影响。

我们使用新近程度数据,是因为市场经常变化,特别是旅游业。最重要的是,旅游是一个季节性很强的业务,所以要关注今天的市场价格,或者去年这个时候的价格。而上个月可能不相关。

在像伦敦或巴黎这样高度发达的市场,获取这个市场的数据非常容易,在我们的网站上有成千上万的房源被预订,并用于比较。对于新兴市场,我们将具有相似规模、旅游业发展水平相当或Airbnb发展阶段差不多的划分为一组。通过这种方式,我们不仅可以在这个城市中比较房源,而且可以和在具有相似特征的其他市场中的房源进行比较。因此,如果一个日本房主是京都首批使用Airbnb出租公寓的用户之一,那么我们可以拿东京或者冈山做参照,因为那些城市对Airbnb来说都是新市场,当然也可以用阿姆斯特丹的数据,尽管对Airbnb来说,这是一个比较成熟的市场,但是它们具有相似的旅游规模和水平。

最后,我们需要考虑位置。与酒店相比,我们房源的位置差别很大。酒店通常集中在几个主要地点,而我们的房源几乎遍布城市的每个角落。

我们定价算法的早期版本绘制了围绕房源的扩展圈,参考了以房源位置为中心的不同半径内的相似房源的价格。虽然有一段时间运行地很好,但我们最终发现了一个致命的缺陷。以我们在巴黎的公寓为例,如果该房源位于市中心,比如卢浮宫和杜乐丽花园旁边的新桥(Pont Neuf),那么我们扩展的圈子很快就会开始包含河对岸的差别很大的社区。在巴黎,虽然塞纳河两岸都是安全的,但是就是这百米的距离,住房的价格差别很大。在其他城市甚至还有更显著的差别。例如在伦敦,最好的格林威治地区的价格可能比泰晤士河对面的伦敦码头附近的价格高出一倍以上。

来源:Airbnb
来源:Airbnb

上涨和下跌:季节性需求和当地事件可能导致价格大幅度波动。如图所示,在德克萨斯州的奥斯汀,租房价格在西南偏南互动节(SXSW)和奥斯丁城市音乐节期间波动很大。

因此,我们请制图师来绘制世界各大城市的每个街区的边界。按照主要的地理和结构特征(如河流,高速公路和交通连接)可以创建非常准确且相关的地理空间划分,我们可以使用这些信息将我们网站上的房源准确的分组。

按照以上规则,在十月份的第一个周末,伦敦格林威治地区的普通双人间的提示价格是每晚130美元,但是在泰晤士河的另一边的相似房间每晚只要60美元。

在我们修复了系统的一个漏洞(系统给所有的新房源都给出99美元的提示价格

)之后,我们对我们的算法很满意。虽然这个漏洞很快就被解决了,并且影响范围不大,但是我们认识到,如果发生这种情况,人们可能会怀疑我们的定价工具是否有用。

我们在之后不断改进算法,直到数以千计的不同因素都能被考虑到,并且透彻地理解地理位置。但是这个工具还有两个不足之处。它给出的价格提示是静态的,它了解当地事件和旅游旺季,因此在同一年的不同日期,一个房源会有不同的价格。然而,它并没有像航空公司那样随着日期的变化而改变价格(在预订缓慢的时候降价,在市场升温的时候提高价格)。

并且工具本身是静态的。它的提示确实有所改善,因为它能兼顾到更多的历史数据,但算法本身并没有变好。

去年夏天,我们开始了一个解决这两个问题的项目。在动态定价方面,我们的目标是当房主的房子即将可以接受预定时,给房主一个新的提示价格。动态定价并不新鲜,几十年前,航空公司就开始运用,通常会实时调整价格,以确保每个座位最高的上座率和最大的收益。宾馆也紧随其后,随着整合的进行,大型连锁店的规模越来越大,使得他们的业务数据不断增加,开始经营网上业务,从而使连锁店每天都能多次更改价格。

因此,一旦我们拥有数年的关于大量房产的历史数据可以使用,尽管需要投入更多的计算资源,进行动态定价对我们来说是很有意义的。

随着时间的推移,使算法自行改进更加困难,特别是因为我们希望我们的系统能够让人类轻易地解释甚至影响计算机的“思考过程”。能够处理我们需求的规模和复杂性的机器学习系统通常难以理解。例如,学会在网上找到猫咪视频的Google Brain(谷歌的一个深度学习研究项目),对数据进行分类的算法一个接着一个,并且其得出一个视频是否为猫咪视频的结论的方式,对于人类来说几乎是不可能复制的。

我们选择了一个称为分类器的机器学习模型。它使用所有房源和当前市场需求的属性,然后尝试按照是否会被预订来进行分类。我们的系统根据数百个属性计算提示价格,例如是否包含早餐以及客人是否能使用私人浴室。然后我们开始训练系统,让它检查提示价格与成交价格。考虑一个房子是否以特定的价格被预订,有助于系统完善它的提示价格,并估计价格被接受的可能性。当然,我们的房主可以选择使用高于或低于提示价格的价格,然后我们的系统相应地调整其可能性的估计。它稍后会检查房子是否被预定,并使用这些信息来调整未来的提示。

插图:Airbnb
插图:Airbnb

你不是我的邻居吗?如伦敦地图所示,算法使用历史定价数据将所有房源划分到一个个小单位。

这只是机器学习的第一步。当某一个特定的房子被预定时,这对我们的系统来说是一个信号,一个让系统开始调整这间房子属性权重的信号。一开始,我们可能会假设地理位置非常重要,而通常情况下,热水浴缸​​的存在并不那么重要。我们保留了以前的定价系统所考虑的商品属性,并且我们添加了新的属性。一些新的信号,如“被预定前空闲的时间”,与我们的动态定价能力有关。我们添加了其他信号,只是因为我们对历史数据的分析结果表明它们很重要。

例如,某些照片更有可能导致预订。一个普遍的现象是,暖色调装饰的舒适卧室的照片比专业摄影师偏爱的灯光明亮的客厅的时尚照片,更能吸引的潜在客人。

我们预计这些信号的权重将不断自动改进,并帮助我们完善价格提示。

如果我们知道算法模型不包含的因素,我们也可以进入系统并影响权重。我们的系统可以为每个价格提示生成一个因素和权重列表供工作人员查看。如果我们认为某些因素没有得到很好的表现,那么我们会手动为模型添加另一个信号。

例如,如果我们知道,在西雅图,一个没有Wi-Fi连接的房子,任何价格都不太可能获得预订,所以我们不必等待我们的系统弄清楚。我们可以自己调整这个指标。

我们的系统还会不断调整我们的地图,以反映区域边界的变化。因此,我们并不是依靠当地的地图来告诉我们,波特兰的森尼赛德(Sunnyside)街区在哪里结束,而里士满(Richmond)街区又在哪里开始,我们是依靠城市内预订和价格差异的数据来绘制边界的。这种方法也可以让我们发现我们之前并不知道的微观街区。这样的地区可能有大量的热门房源,但不一定会处在标准街区边界之内,也可能是一些局部特征使得较大的传统街区的一小部分更加有吸引力。

这些工具正在为全球范围内的Airbnb用户提供价格提示。但是我们认为它可以做更多的事情,而不仅仅是更好地给潜在的房主提供价格提示。这就是我们已经将这些工具所依赖机器学习平台Aerosolve开源的原因。这将给那些还没有拥抱机器学习的工业界人士带来一个简单切入点。人们知道这个系统在做什么后,会消除恐惧因素,还会更多地采用这些工具。到目前为止,我们已经用它建立了一个制作点彩派绘画的系统。我们非常希望看到其他行业具有创造力的工程师使用这个工具的成果。

这篇文章最初以“您的空闲房间的价值有多少?“为标题。

关于作者

Dan Hill,Airbnb的产品线负责人,住宿租赁网站的定价算法作者。住房共享公司Crashpadder的联合创始人,该公司于2012年被Airbnb收购。Hill一开始用Web开发所赚的钱来支持自己的小提琴事业。他在最近的一次采访中说:“直到有一天我才意识到我没有真正关注小提琴”。他的下一个想法是“我真的想把我的一生花在技术和产品上。”

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 关于作者
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档