首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从大数据看游客行为

编者按:本期向大家推荐的是西班牙学者María Henar Salas-Olmedo等于2018年发表在Tourism Management的Tourists' digital footprint in cities: Comparing Big Data sources一文。目前,关于城市游客的空间行为知之甚少,但游客在访问城市时会产生大量的数据,这些数据源可用于通过他们的活动跟踪他们的存在。本文的目的是通过大数据分析城市游客的数字化足迹。作者使用Panoramio、Foursquare和Twitter三种数据来源,以反映城市中不同的旅游活动。结果表明,三种活动的数据在一定程度上是空间冗余的,部分是互补的,并允许对一个或多个活动的多功能旅游空间和空间进行特征化;在一些中心地区旅游密度很高,这些中心地区可以被视为多功能旅游区,因为它们具有高度集中的旅游景点、设施和住宿。此外,旅游专业化程度从历史中心向外围方向辐射。主要结论:仅使用一个数据源来分析城市游客的存在是不够的,几个必须以互补的方式使用。

一、引言

随着经济社会的发展,人们生活方式和价值观念的转变,旅游逐渐成为一种消费方式。传统上,通过调查研究城市游客的空间行为。但是,调查并未提供有关游客行为的大量时空数据。在过去几年中,GPS技术的发展运用正在帮助研究人员开发新的空间研究方法:全球定位系统允许对个人进行精确且连续的跟踪,并提供丰富的空间数据,使人们能够准确追踪游客的路径,并更好地理解他们的社会空间行为。近年来也有几项研究使用了GPS来分析游客的空间行为,然而,这些研究大多使用小样本。

大数据为旅游研究提供了新的机会,可以分析游客的时空行为。大数据提供了大量信息来补充传统来源。游客在大部分活动中留下了数字“足迹”,而这些新的数据来源现在可以分析游客的游览行为:他们拍摄大量照片并上传到照片共享,使用银行卡支付,通过手机发送消息,活跃在社交网络上,等等。所有这些活动都会产生大数据,这些数据可以用来研究行为模式。这些数据中的大部分都是地理定位的,因此可以在空间上分析游客的活动。然而,很少有文章应用大数据来检验城市游客的空间分布,这可能是由于这些信息来源的新颖性以及一些难以获取的事实。

本文以马德里市(欧洲游客数量最多的城市之一)为研究区域,通过比较Panoramio、Foursquare和Twitter三个定位数据源,以根据其不同活动来确定城市中游客的存在:利用Panoramio平台区域的地理定位照片用作观光代理,使用Foursquare签到作为消费代理,使用社交网络Twitter上的互动作为连接——住宿的代理。

二、研究设计

(一)研究领域:马德里

本文的研究区域为马德里市。马德里是一个历史悠久的城市,有大量游客。具体研究区域的划定基于行政划分的马德里市,它的面积为6043平方公里。2016年有316万居民,人口密度很高,每平方公里有5200个居民。

根据国家统计局的数据,马德里在2016年接待了900万游客。在过去的十年里,它的受欢迎程度大大提高。2007年,游客总数达到730万人次,在过去十年中增加了24%。国际游客数量增加更多,从2007年的340万增加到2017年的460万(增长35%)。游客的大量涌入对这座城市产生了巨大的经济和社会影响,2016年产生了超过7.6亿欧元的收入。

(二)研究方法

以下方法用于分析马德里游客的空间分布:

1、每个普查区的游客人数。根据人口普查区查找游客照片、Foursquare签到和微博,统计每个人口普查区单一游客人数和每个数据源用户ID的人数。通过联合空间(人口普查区)聚合将行政数据转换为单个游客,以获得每个人口普查区单个用户的数量。

2、游客密度。每个普查区的游客人数取决于普查区游客的实际集中程度及其规模。较大的人口普查区往往有更多的游客。为了缓解这个问题(可修改的区域单元问题-MAUP),每个数据源均获得每个人口普查区的旅游密度。与常规单位(网格)相比,利用人口普查,可以从土地利用角度得到相对均匀的空间区域。人口普查区还允许确定一些参考区域,如公园、足球场、大型购物中心等。

3、数据重新调整。通过三个数据来源发现了不同数量的游客。 为了消除数据源中不同范围的影响并使密度数据具有可比性,根据人口普查通道,通过线性交易,对访问者的密度数据重新缩放到0-1000的比例。

4、密度图和描述性统计。通过人口普查资料收集的数据,获得密度图和描述性统计。根据三个数据集,密度图提供了马德里游客密度分布的初步概览。描述性统计数据有助于比较用户的集中度和使用的数据源。

5、OLS分析。使用双变量普通最小二乘法(OLS)比较三个数据源获得的结果。确定系数揭示了每对数据源之间的共同变化,并且可以使用标准化残差图来分析每对数据源之间的差异。

6、聚类分析。采用聚类分析方法,将三种数据来源的信息进行整合,并根据所进行的旅游活动,对人口普查区进行特征描述。

7、空间自相关分析。与以前的分析不同,空间自相关技术并不以孤立的方式考虑每个位置,而是考虑到其环境位置。使用半径为500 m的IDW(反距离加权)方法,对三个数据源分别计算全球Moran's I统计量和Anselin Local Moran's I(LISA统计量)。LISA分析确定了HH旅游者群体(主要由高价值包围的高价值群体)。将这些结果结合起来,以确定每一个人口普查区域的专业化程度,可以将其划分为观光区、旅游消费、互联网消费或两种或三种类型的组合(例如消费和观光)。根据这三个数据源,一个分类为HH集群的人口普查区意味着在一个半径为500的范围内,这三种类型的活动具有很高的潜力。

所有这些计算和地图都是使用ArcGIS 10.4软件完成的。

三、结论与讨论

(一)结论

本文的目标是通过不同的大数据来源(Panoramio,Foursquare和Twitter)跟踪游客的活动,并对数据源进行比较。这些数据来源提供了关于城市游客时空格局的大量信息。作者利用数据集进行不同类型的分析。首先,双变量相关分析结果显示:Panoramio和Twitter以及Panoramio和Foursquare的旅游密度分布几乎没有相似之处,但Foursquare和Twitter的游客空间格局存在一定的相似性。其次,运用聚类分析方法,根据旅游者留下的数字足迹强度,将城市旅游区划分为更倾向于观光、消费或互联网连接的城市旅游区。最后,空间自相关分析通过考虑每个人口普查区(不是孤立的,而是相对于其周围的人口普查区)来显示旅游活动。全球分析证实,Panoramio揭示的空间自相关性最低(具有多个空间群集)。通过将三个数据源的结果结合起来,可以将进行不同活动的领域与那些具有更专业性质的活动区分开来。此外,专业化程度从历史中心向外围方向发展。

本文中使用的数据来源和方法学方法有助于更好地理解城市旅游活动,但尚未得到充分发展。调查结果表明,仅仅使用一个数据源来理解城市游客的空间分布是不够的,因为游客参与不同空间的不同活动。这三个数据来源表明,在一些中心地区旅游密度很高,那里有很多古迹、商店、酒店、餐馆等等。研究人员确定的空间集群证实了这一趋势。这些中心地区可以被视为多功能旅游区,因为它们具有高度集中的旅游景点、设施和住宿。然而,游客的数字足迹也延伸到城市其他地区(足球场、斗牛场、商业区、大型公园等)。与大多数中心旅游区的多功能特征相反,从旅游角度看,历史中心以外的空间集群往往更加专业化,因此旅游专业化倾向于从历史中心向外围辐射。

(二)讨论

推特的使用似乎与住宿的位置有关,因为推特数据覆盖的住宿选择范围很广,且时间集中在18到22小时之间。目前国际电话的高电话费迫使游客使用Twitter,并利用WiFi网络进行住宿。正如预期的那样,Twitter数据往往集中在历史中心及其周边地区。这一结果与之前关于酒店位置和P2P住宿的研究结果一致,这表明靠近旅游景点是游客选择住宿的一个重要因素。2017年欧盟国家间的国际电话费被取消后,这个变量可能会在一定程度上失去其作为这类旅游活动的代理的作用。最后,Foursquare的入住登记在专门从事消费(餐馆和购物)的地区特别密集,不仅在城市的历史中心,而且在豪华购物区和购物中心,这表明Foursquare是用于定位游客与消费相关活动一个很好的代理。

与其他使用大数据的论文一样,也存在潜在的偏差问题。大多数游客不会将他们的照片上传到像Panoramio这样的照片共享社区,有些甚至不会拍照(比如有些景点禁止拍照),因此照片并不总是能够正确反映该城市的所有古迹。许多游客不使用Twitter或Foursquare等社交网络,只有一小部分Twitter用户发送地理定位的状态。源偏见无疑难以确定和纠正。在本文中,通过与游客的密度而不是他们的足迹密度(照片、Foursquare签到或推文)一起工作,减少了偏差,并且避免了对同一旅游者进行重复计数。这在强制用户的情况下尤为重要。另外,通过比较不同的数据来源,研究者考虑了不同的旅游活动,这部分抵消了只使用一种来源造成的偏差。

城市游客的空间分布知识对公共政策极为重要。因此,例如在游客高度集中的空间,地方当局可能需要设想改善游客体验的行为,例如创建行人专用街道或拓宽人行道,利用免费WiFi扩展公共空间,寻找新的旅游信息点等。游客拍摄照片的空间分布显示,有些空间具有较高的旅游潜力,但仍处于开发阶段(例如马德里里奥轴线)。这一结果对于为私营部门确定新的商业机会也很重要,例如通过确定仍有扩张机会的经济区域来寻找零售旅游业地区。

利用社交网络数据进行旅游研究是一个有前途的领域。然而,在研究中使用这些数据来源可能会引发隐私和道德问题。研究人员不仅应该保持用户的匿名性,还应该避免不恰当地使用来自社交网络的信息。

文献来源:

María Henar Salas-Olmedo et al(2018). Tourists' digital footprint in cities: Comparing Big Data sources.Tourism Management,pp.13-25.

文献整理:付双乐

这是社论前沿第S942期推送

微信号:shelunqianyan

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180512B0FLCU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券