专栏首页Crossin的编程教室今天,你抢到票了吗?

今天,你抢到票了吗?

今天网上开始预售除夕前一天的火车票。

这几天,办公室的小伙伴们每天准点蹲在电脑前,不停地刷新页面,可最终还是眼睁睁看着一秒之后就显示“无票”了。(╯‵□′)╯︵┻━┻

无奈之下,只能寄希望于之后几天会有些余票或者退票被放出来。但总不能接下来一直开着网页不停刷吧……好在我们还有 Python 啊,就让程序定时去查咯。

之前也放过查票的代码,参见:刷票有风险,抢购需谨慎

1. 我们用 Chrome 进入 12306 余票查询网页,打开开发者工具(右键“审查元素”或者 F12/ctrl+shift+i),菜单栏选择 Network。

2. 填写出发地和目的地以及出发日后(这里以1月11日上海到北京为例),点击“查询”,在 Network 栏目下,可以看到发出的所有请求。仔细观察后发现,其中一个带有 query 字样的地址就是余票的查询接口,从信息栏中 Headers 分页下的 Request URL 可以看到它的完整地址。

这里注意,12306 现在有两个查询余票的页面,不同页面上看到的接口地址是不一样的。分别是:

旧版:

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2017-01-11&from_station=BJP&to_station=BJP

新版:

https://kyfw.12306.cn/otn/leftTicket/queryZ?leftTicketDTO.train_date=2017-01-11&leftTicketDTO.from_station=SHH&leftTicketDTO.to_station=BJP&purpose_codes=ADULT

两个接口的参数和返回值也不相同。这里我们用新版的接口。

在 Python 2 中,我们可以通过 urllib2 直接访问接口,获取返回数据。Python 3 可以使用 urllib.request 或者 requests 库。

req_url = 'https://kyfw.12306.cn/otn/leftTicket/queryZ?leftTicketDTO.train_date=2017-01-11&leftTicketDTO.from_station=SHH&leftTicketDTO.to_station=BJP&purpose_codes=ADULT'

resp = urllib2.urlopen(req_url)

resp_info = resp.read()

print resp_info

在程序中输出结果,或者直接在浏览器中打开这个请求地址,可以看到返回值。

如果请求时报错:

<urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:590)>

需要加上以下代码,忽略 ssl 证书的验证:

import ssl

ssl._create_default_https_context = ssl._create_unverified_context

这些密密麻麻看上去有点像是字典格式的数据就是 json 数据。通过浏览器 json 插件或者搜索下 json 在线解析工具,可以让这些数据显示得更人性化。

不难看出,我们需要的车次余票信息就在每一车次全部相关信息中,而这也信息以字典列表的形式,储存在“data”的值中。因此,我们若要查询余票,就该先把 json 格式的数据转为字典,获取其中的 data 列表,然后遍历列表,查询车次,最后从该车次对应的字典字段中,查询余票。

info_json = json.loads(resp_info)
info = info_json['data']
for train_data in info:
    train = train_data['queryLeftNewDTO']
    if train['station_train_code'] == TRAIN:
        print '商务座:', train['swz_num']
        print '特等座', train['tz_num']
        ...
        print '无座', train['wz_num']
        print '其它', train['qt_num']

为了让程序一直查询下去,我们用一个条件为 True 的 while 循环。再配合上 time 模块的 sleep 方法(参数单位为秒),让程序每查询一次就休息一会儿。毕竟我们只是想要定时刷一下页面,没必要一直发送请求。

while True:
    # 查询余票代码
    time.sleep(600)

现在,在你的电脑上运行代码,就可以每隔 10 分钟自动去访问一次页面,看看是否有新的余票放出。当然,你得根据自己的需要,去修改请求地址里的日期和出发、到达站的代号。

在本公众号(crossincode)里回复 查票,获取本篇的完整示例代码。

如果你还希望程序在刷出票后,能给你发个邮件提醒的话,请查看我们之前的文章:简单三步,用 Python 发邮件 或者在公众号里回复 邮件

说明几点:

  1. 这个程序只是定时访问公开页面,查询余票信息,无需登录和验证码,但并不能自动替你购票。
  2. 请设定适当的查询间隔,没必要高频刷新。合理使用此脚本不会比手动刷新页面给网站带来更大压力,只是免去了你时刻关注页面的烦躁。
  3. 掌握这个方法,也可以查询其他购票网站,或用在类似的页面信息查询上。
  4. 由于最近在春运购票高峰,接口访问可能会比较慢,甚至请求失败。
  5. 这不是抢票工具,它做不到,我们也不建议使用类似工具干扰正常的购票秩序。

最后,祝大家身体健康,都能买上票,高高兴兴回家过年!

本文分享自微信公众号 - Crossin的编程教室(crossincode),作者:助教达达

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-12-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【每周一坑】让程序替你等待

    管挖不管埋的每周一坑又来了,今天是个实用的坑。 在1999年的时候,曾经有人搞过一场真人秀,就是给你一些钱和“电子货币”,把你关在一个可以上网的房间里。你需要借...

    Crossin先生
  • #PY小贴士# URL里面为什么会有乱码?

    在做网络爬虫的程序或者开发网站的时候,有时会发现 URL 地址里有类似这样的『乱码』,是怎么回事?

    Crossin先生
  • 【Git 第4课】 创建Git仓库

    上次安装了 Git 之后,我让大家用命令: git clone https://github.com/crossin/CrossinClass.git 把我在 ...

    Crossin先生
  • 由Impala-3316导致的并发查询缓慢问题

    Fayson
  • Python多进程编程

    阅读目录 1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 序. multi...

    小小科
  • Java-BlockingQueue 接口5大实现类的使用场景

    BlockingQueue即我们所说的阻塞队列,它的实现基于ReentrantLock,通常我们谈及到阻塞队列,都会和生产者/消费者模式关联起来(这是最常用的场...

    每天学Java
  • 3A安全认证服务

    计帐(Accounting):记录用户对各种网络服务的用量,并提供给计费系统。整个系统在网络管理与安全问题中十分有效。

    py3study
  • 测试python程序运行时间

    经由测试,print()花费时间大约是1e-6s,decimal运行花费的时间大约是int的三倍。

    py3study
  • 04.OCR学习路径之文本检测(中2)FCN算法简介

    FCN是基于深度学习的语义分割的开山之作,尽管现在很多方法都超越了FCN,但它的思想仍然有很重要的意义。

    Aalto
  • Mifa 主题微信编辑器

    blabla ? 打开 md.phodal.com 即可使用

    Phodal

扫码关注云+社区

领取腾讯云代金券