亲测,手把手教你用Python抢票

关于转载授权

大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+转载”,申请过授权的不必再次申请,只要按约定转载即可,但文末需放置大数据文摘二维码。

大数据文摘曾经推出多篇Python的文章,这里介绍3篇,点击文字即可阅读

(1)初学指南| 用Python进行网页抓取

(2)用Python进行数据可视化的10种方法

(3)天龙八步 第二弹:8步从Python白丁到专家,从基础到深度学习

程序设计:刘博 撰文:席雄芬 姚佳灵

随着春节的临近,大家都在和12306斗智斗勇。今天,大数据文摘推出不到100行的Python程序帮助大家来抢票。

首先说明一下,我们程序的出发点是能用机器做的事就用机器做,需要人来做的事还是要自己来做。因此,12306上五花八门的验证码还是需要大家自己动手输入确认的。另外,本程序对容错什么的考虑较少,请大家见谅。

我们要用到浏览器chrome,还没有安装的读者可以从这个下载地址下载chrome并进行安装:http://chromedriver.storage.googleapis.com/index.html?path=2.20/,大家可以根据自己的电脑系统选择下载包进行安装。如果你用的是MAC,可以直接通过brew install chromedriver来安装。

现在一切就绪,让我们学习一下这个Python程序。

Splinter是一个自动化测试网络应用的Python库。有了Splinter,就可以将打开浏览器、输入URL、填写表单、点击按钮等全部操作自动化。因此,我们需要引入这个库。通过pip install splinter来安装。

1 from splinter.browser import Browser

2 from time import sleep

#traceback模块被用来跟踪异常返回信息

3 import traceback

# 设定用户名,密码

4 username = u"用户名"

5 passwd = u"密码"

# 起始地址的cookies值要自己去找, 下面两个分别是上海, 营口东。如何找,我们在文#后有简单的介绍

6 starts = u"%u4E0A%u6D77%2CSHH"

7 ends = u"%u8425%u53E3%u4E1C%2CYGT"

# 时间格式2016-02-01

8 dtime = u"2016-02-01"

# 车次,选择第几趟,0则从上之下依次点击

9 order = 0

#设定乘客姓名

10 pa = u"乘客姓名"

#设定网址

11 ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init"

12 login_url = "https://kyfw.12306.cn/otn/login/init"

13 initmy_url = https://kyfw.12306.cn/otn/index/initMy12306

#登录网站

14 def login():

15 b.find_by_text(u"登录").click()

16 sleep(3)

我们在这里尝试了模拟登录12306,得到结果如下:

登录页面成功显示!

#第17至20行代码用于自动登录,username是12306账号名,passwd是12306密码

17 b.fill("loginUserDTO.user_name", username)

18 sleep(1)

19 b.fill("userDTO.password", passwd)

20 sleep(1)

在我们的模拟登录中,结果如下:

成功登录!

接下来的验证码还是要大家自己动手输入啦!据说12306的验证码辨识难度堪比常识竞赛。在此,大数据文摘祝你好运!

21 print u"等待验证码,自行输入..."

22 while True:

23 if b.url != initmy_url:

24 sleep(1)

25 else:

26 break

#购票

27 def huoche():

28 global b

#使用splinter打开chrome浏览器

29 b = Browser(driver_name="chrome")

#返回购票页面

30 b.visit(ticket_url)

现在让我们来看看程序运行结果

看到了吗?网页能正常打开!

31 while b.is_text_present(u"登录"):

32 sleep(1)

33 login()

34 if b.url == initmy_url:

35 break

36 try:

37 print u"购票页面..."

38 # 跳回购票页面

39 b.visit(ticket_url)

40 # 加载查询信息

我们的模拟登录中以上海为始发站,营口东为终点站,时间选定2016年2月1日

41 b.cookies.add({"_jc_save_fromStation": starts})

42 b.cookies.add({"_jc_save_toStation": ends})

43 b.cookies.add({"_jc_save_fromDate": dtime})

44 b.reload()

让我们一起来看看运行结果如何?

45 sleep(2)

46 count = 0

47 # 循环点击预订

48 if order != 0:

49 while b.url == ticket_url:

50 b.find_by_text(u"查询").click()

程序自动点击查询后,结果如下:

51 count +=1

52 print u"循环点击查询... 第 %s 次" % count

53 sleep(1)

54 try:

55 b.find_by_text(u"预订")[order - 1].click()

程序自动点击预订后,结果如下:

哇啦!我们成功预订了春运车票!

56 except:

57 print u"还没开始预订"

58 continue

59 else:

60 while b.url == ticket_url:

61 b.find_by_text(u"查询").click()

62 count += 1

63 print u"循环点击查询... 第 %s 次" % count

64 sleep(1)

65 try:

66 for i in b.find_by_text(u"预订"):

67 i.click()

68 except:

69 print u"还没开始预订"

70 continue

71 sleep(1)

注意:可以通过修改sleep的参数来调整延时, 但延时不要太低, 防止被12306网站认为是刷票屏蔽掉.

72 b.find_by_text(pa)[1].click()

如果你运气不好,程序会给出一个这样的信息:

73 print u"能做的都做了.....不再对浏览器进行任何操作"

如果出现这样的信息,你也不要灰心,重新执行程序,让好运降临!

74 except Exception as e:

75 print(traceback.print_exc())

76 if __name__ == "__main__":

77 huoche()

小技巧:

如何在chrome中获得起始站和终点站等的cookie值?

大家可以先登录一下12306,输入地点日期什么的查询一下,然后在chrome浏览器中按F12,出现如下页面,在resource选项里找到相应的值。

大家可以看到对应表格中的cookie值:

_jc_save_fromeStation的值为出发地

_jc_save_toSatation的值为目的地

_jc_save_fromDate 出发日期

_jc_save_toDate返程日期

看到这里,你还不快点动手抢票?

备注:程序源代码链接在此,点击文末“阅读原文”即可:https://github.com/Akagi201/learning-python/blob/master/splinter/huoche.py,并且在不断更新中。

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-12-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信技能树

我的第一R包- 生信配置文件大全

大家好,我是李剑峰,生信技能树论坛的VIP小编,目前在上海交通大学医学院附属瑞金医院进行研究生阶段的学习,主要研究方向是生物信息学、医学信息学、大数据综合分析、...

42190
来自专栏python爬虫实战之路

12306自动刷票下单-查票

上篇写了12306登录,隔了快一个月了,才准备动手写下单篇,真的要非常感谢博客园的 Asimple朋友,如果不是看到你的留言,我几乎都忘了要写下篇了,这一点在简...

45680
来自专栏zhangdd.com

zhangdd谈ceph(一)初识ceph

最近在研究ceph分布式存储,刚开始接触时感觉很混乱,无从下手的感觉。于是根据以往经验,先网上看各种资料,一个字 感觉乱,各种配置 各种环境 各种bug 各种坑...

13720
来自专栏程序人生

深入了解IAM和访问控制

本文为InfoQ中文站特供稿件,首发地址为:http://www.infoq.com/cn/articles/aws-iam-dive-in。 访问控制,换句话...

60770
来自专栏逸鹏说道

前后端分离了,然后呢?

  前言   前后端分离已经是业界所共识的一种开发/部署模式了。所谓的前后端分离,并不是传统行业中的按部门划分,一部分人纯做前端(HTML/CSS/JavaSc...

32370
来自专栏V站

图片API丨V站二次元随机图片API(自判断)

①于2018.03.31公布,采用高速服务器运行! ②PC版随机图片拥有200+张,PE版拥有100+张超精美二次元风随机图片,每星期一更! ③全程免费,欢迎支...

5.1K100
来自专栏Google Dart

开始使用-安装 顶

在Dependency Injection指南中你学会了基础的Angular依赖注入. Angular有一个层级依赖注入 系统. 实际上是一个与组件树相平行的...

7810
来自专栏架构师小秘圈

为什么分布式一定要有redis?

1.1K40
来自专栏Google Dart

AngularDart4.0 高级-层级依赖注入器 顶

在Dependency Injection指南中你学会了基础的Angular依赖注入. Angular有一个层级依赖注入 系统. 实际上是一个与组件树相平行的...

7010
来自专栏happyJared

Linux私房菜:回头去学

说来惭愧,从学编程到现在写代码,算是用过不少东西,不过很多只停留在半解半知的状态,包括Linux在内,一直以来还没有较为系统的从基础开始学起。最近逼着自己回头看...

10220

扫码关注云+社区

领取腾讯云代金券