什么是“爬虫”技术?导致你买不到特价机票的原因

有“机票代理”公司正在利用“爬虫”技术,抢占航企官网放出的低价票,利用航企允许的账期反复订票、退订,直至将票加价卖出。有专家指出,利用“爬虫”技术从虚占到变现过程不复杂,但是要形成暴利,就需要来回如上过程无数次。对此,几家知名航企均拒绝透露低价票被抢走的数量,但均表示“反爬虫”大战已经硝烟四起。

­  2016年7月1日起,国内一批航空公司推出“票代”下调机票代理佣金新政,南航、东航相继将机票代理商手续费下调至零。一部分机票代理转行改做旅游度假产品,也有少部分机票代理人动起了歪脑筋。近日,有自媒体曝出,“机票代理”行业很多小公司正在利用“爬虫”技术,抢占航企官网放出的低价票,利用航企允许的账期反复订票、退订,直至将票加价卖出,全程操作中“爬虫”可替代95% 的人工操作量。

­现象

­  朋友圈里有人卖特便宜的机票

­  据悉,有部分机票代理人会雇用专业技术人员,利用“爬虫”技术长期到各家航企抢舱位。他们最青睐的舱位包括特价舱位、寒暑假或者黄金周等特殊时段热门航路的舱位等。

­  “我朋友在朋友圈卖票,北京往返大阪的往返机票只需2599元”,旅游达人彭小姐说,她在该航企的APP上查同样的票已经涨到7150元。该朋友说她可以通过渠道抢到便宜的票。

­  据不愿透露姓名的业内人士透露,可能的操作手法是航企一旦放出票,“爬虫”即刻爬取到信息,并利用虚假身份暂时预订;机票代理人再通过自有渠道,如自有网站、APP、微店、淘宝店或者朋友圈等方式转售加价卖出。利用因时间推移造成的舱位价格变化获利。

­释疑

­  “爬虫”抢票变现过程并不复杂

­  “虚占座位”早期是为保障一些团队的机票冗余,当时现象也并不是很多;但现如今主要目标是为了囤积后伺机出售实现利益最大化。

­  “想获取100万行的数据,大约需忘寝废食重复工作两年。而‘爬虫’可以在一天之内帮你完成”,岂安科技风险情报专家笑天发文解释说,监测发现“爬虫”在航企官网通过大量下订单,在规定时间内(各航线不同)不支付,并把抢占的舱位放到 OTA 、机票 B2B 上出售;规定时间内卖不出去,在被取消订单前,订单失效前马上再去追一个订单,继续把位置占住;如果出售成功,就可以把原来占位的机票取消掉,再用客户的身份信息订票并出票。虽然从虚占到变现过程不复杂,但是要形成暴利,就需要来回如上过程无数次。

­应对

­  航企已打起“反爬虫”大战

­  据了解,航企风控技术部门的“反爬虫”技术高手正在迎战。常规“反爬虫”技术包括访问频率控制、使用代理IP池、抓包、验证码的OCR处理等。其中,IP 来源单一、从未成交过订单且行动异常的IP、点击频次过高等被识别出的“爬虫”,会被封掉IP。对此,操作“爬虫”的技术人员会想办法利用购买或者租用的云机房、IDC 中的 IP 资源,改造路由器等方法来“伪装”。

­  针对航企低价票放出即被“爬虫”抢走的问题,几家知名航企均拒绝透露低价票被抢走的数量。但均表示“反爬虫”大战已经硝烟四起,由于涉及技术保密不便透露细节,不过确实形势严峻。

本文来自企鹅号 - 闽南网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏禁心尽力

互联网项目架构之基于服务的分布式架构

  随着互联网电商项目的发展,越来越多的购物平台等都使用SOA分布式来作为系统主要架构。为什么有那么多的电商项目都选择SOA作为系统架构呢?这肯定是存在一定原因...

23010
来自专栏云计算

迁移到微服务架构

在这篇文章中,我将介绍我对于一些微服务相关问题的看法。第一个问题是为什么金融科技公司应当把遗留的传统架构应用迁移到现代的架构风格上;其次,如何在这一范式迁移过程...

1856
来自专栏Frank的专栏

云端微服务架构下的运维思考

本文围绕微服务架构的特点与发展趋势,结合微信业务在微服务架构上的探索、应用、改进与提升,阐述运维如何应对业务在微服务架构环境下的各种挑战。

8627
来自专栏程序你好

微服务架构: 什么是微服务, 是什么时候和怎么使用微服务

773
来自专栏云加头条

腾讯云 API 网关产品发布

腾讯云已在近期上线了 API 网关产品,协助开发者通过简单方式即可完成 API 配置管理、发布版本、访问控制等功能,并可进一步对接腾讯云云市场中的 API 市场...

8372
来自专栏WeTest质量开放平台团队的专栏

【干货预警】kafka+sparkstreaming搭建流计算引擎

周期性拉取增量时间段内,各词在各渠道内的索引数据,然后进行分时频次统计,复杂度:如果词库大小增长到10w,渠道数达到5000,那么就需要5亿次/轮的索引查询开销...

693
来自专栏数据和云

遇见未来 | PostgreSQL:一匹即将发力的黑马

在2017年的DB-Engine的年度数据库榜单上,PostgreSQL以其超过其他341个受监控数据库管理系统的受欢迎程度居于榜首,被评为年度DBMS。其总体...

4196
来自专栏Snova数据仓库

Snova数仓简介

Snova为您提供简单、快速、经济高效的PB级云端数据仓库解决方案。借助于Snova,您可以在数分钟内创建拥有数百节点的企业级云端数据仓库,并高效的完成日常维护...

1052
来自专栏云计算D1net

管理混合云和多云:代理或无代理?

导语 混合云在节省更多IT成本方面提供更多的潜力,并将这些成本节约转向改善业务成果,但却带来了一些独特的挑战。人工手动的流程在一个混合的世界变得难以管理,因为云...

32810
来自专栏云计算D1net

公共云中的灾难恢复

1799

扫码关注云+社区