春运抢票!用技术手段抢到回家的票?

抢票时间节点要牢记

1月13日开抢腊月廿六,即2月11日的火车票。

1月14日开抢腊月廿七,即2月12日的火车票。

1月15日开抢腊月廿八,即2月13日的火车票。

1月16日开抢腊月廿九,即2月14日的火车票。

1月17日开抢除夕,即2月15日的火车票。

2018年春运又将到来,每年的春运抢票都是大家回家前要跨过的一道坎,各种火车票抢票攻略漫天飞,可以说是一场火车票抢票大战。

今年春运期间,互联网(手机客户端)订票预售期为30天(含当天),电话订票预订期为4-30天(含当天),代售点、自动售票机预售期为28天(含当天)。

昨天(1月12日)起,旅客可通过网络、电话订票购买到腊月二十五(2月10日)的火车票,根据铁路部门此前预测,腊月二十五到腊月二十八,是节前购票最高峰,这期间将出现务工返乡流高峰。

作为程序员,如何用技术手段抢到回家的票?来看看用 Python 写的抢票脚本。

手把手教你用 Python 抢票回家过年

环境介绍

windows 8.1

python3.6.1

firefox插件 geckodriver.exe

操作步骤

下载:geckodriver.exe 。

下载地址:

https://github.com/mozilla/geckodriver/releases

提到的 stations.txt 可以直接看这个:

browser.get(“https://kyfw.12306.cn/otn/login/init”) #启动浏览器后进入该链接下

browser.find_element_by_id(‘username’).clear()

browser.find_element_by_id(‘username’).send_keys(‘xxxxx’) #xxxxx更换为用户名

browser.find_element_by_id(‘password’).send_keys(‘xxxxx’) #xxxxx更换为密码

time.sleep(10) #此时验证码自行点击,该处设置10秒延迟,可以自己设置

try:

browser.find_element_by_id(‘loginSub’).click() #点击登陆操作,该id为登陆按钮

#或者 browser.find_element_by_link_text(‘登陆’).click() #标签显示的名称

except:

browser.find_element_by_class_name(‘touclick-bgimg touclick-reload touclick-reload-normal’).click() #try中验证码输入点错了会在此处刷新一次

time.sleep(20) #第二次输入验证码前等待20秒,可以自己设置,第一次输入无误直接跳过

browser.find_element_by_id(‘loginSub’).click() #重新输入验证码后的点击登陆

跳转模块

#默认跳转到首页

time.sleep(2) #此处一般无需设置时间等待,调试代码时使用

clickReserve = browser.find_element_by_link_text(‘车票预订’).click() #跳转到车票预定页面,该页面可以查询票

time.sleep(2) #出发地点和到达地点设置

#此处value值为出发时刻的地点,BJP表示北京,更改value值在页面上不加载,基本不耗时间,从页面中也看不到出发地和目的地

#此处内容以爬取,保存在stations.txt中,每行表示一个地址,打开文档ctrl + F查找即可

jsf =‘var a = document.getElementById(“fromStation”);a.value = “BJP”‘#此处将BJP更换为你需要的出发地址,value值在以爬取到stations.txt中,自行查看

browser.execute_script(jsf)

jst =‘var a = document.getElementById(“toStation”);a.value = “LZJ”‘#终点,同上方法

browser.execute_script(jst)

js =“document.getElementById(‘train_date’).removeAttribute(‘readonly’)”#时间选择时默认为只读,通过JS移除只读属性

browser.execute_script(js) #执行JS语句

browser.find_element_by_id(‘train_date’).clear() #时间元素中默认有提示字,需要先清空

browser.find_element_by_id(‘train_date’).send_keys(‘2018-02-01’) #按照改格式输入需要查询的时间

search = browser.find_element_by_id(‘query_ticket’).click() #输入好信息时点击查询,该处存在成人票和学生票,默认是成人票,如果购买,对学生票处执行以下语句即可:

#browser.find_element_by_id(‘xxxx’).click() #对于id还是class或其它自行选择,[可以查看此处](http://blog.51cto.com/12376665/2052278)

开始购票

此处,就是点击预定的操作,我在这里只是举一个方法例子,也可以通过不断点击直到成功(这样可以避免网站倒计时和实际时间的时间差影响,但是不知道 12306 在抢票时对不断快速访问有没有限制)。

start_time =“Thu Jan 04 08:00:00 2018”#首先设置需要抢票的时间

b =time.mktime(time.strptime(start_time,“%a %b %d %H:%M:%S %Y”)) print(time.strftime(“%a %b %d %H:%M:%S %Y”,time.localtime(b)) ) #此处是为了调试代码使用,可忽略,不影响使用

a =float(b)-time.time() #利用自己设置的时间减去当前时间的时间戳

time.sleep(a) #上一步骤得出的秒数就是需要等待抢票的时间

try: #此处本来有try中的部分就够了,WebDriverWait已有相应等待重复访问机制,默认为0.5秒试验一次,except中添加是为了以防万一

WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID,“ticket_2400000Z550L”))) #查找需要预定的车次的id,直到出现,10表示共等待10秒

ticket = browser.find_element_by_xpath(‘//tr[@id=”ticket_2400000Z550L”]/td[13]/a’).click() #点击预定按钮except:

browser.find_element_by_id(‘query_ticket’).click()

WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.ID,“ticket_2400000Z550L”)))

ticket = browser.find_element_by_xpath(‘//tr[@id=”ticket_2400000Z550L”]/td[13]/a’).click()

“””

normalPassenger_8 数字表示该账号下的第几位,默认从0开始如果是第一个则为normalPassenger_0

“”“WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID, “normalPassenger_8″)))

browser.find_element_by_id(‘normalPassenger_8’).click() #id中的8表示账号下第九位s =Select(browser.find_element_by_id(‘seatType_1’))

s.select_by_value(‘6’) #此处value值看下方各个种类,6表示高级软卧browser.find_element_by_id(‘submitOrder_id’).click()

WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID,“qr_submit_id”)))

browser.find_element_by_link_text(‘提交订单’)

browser.find_element_by_id(‘qr_submit_id’).click()#————————————————-结束#硬座 1#硬卧 3#软卧 4#高级软卧 6#二等座 O(大写字母)#一等座 M#商务座 9

有人说用浏览器执行速度会慢,确实对于可以直接识别验证码的脚本而言,没有界面的会更快一些,但是实际上所用时间为预定开始到结束,相同网络下,代码执行时间是要快于人工操作的,

另外,时间可以研究一下,之前研究过某宝的时间,秒杀时间是要比北京时间提前一点几秒的,感觉全国各地有微小时间差的。

完整脚本示例

#python3.6.1#data:2018-01-03#author:LGC247CG“””

说明:

1.该脚本主要是提供一个实现思路,实现方法有很多,可以优化的地方也有很多,触发机制也可以自己设置,代码以压缩到最短,只是为了让大家都可以看明白

2.正常网络状况下,不设置指定时间时,从点击确认验证码到下单基本上1秒左右,所以速度上还是没问题的

3.由于同时勾选多人和单人使用所需时间基本相同,希望该方法只用于技术交流,请勿作为黄牛使用

4.在作为技术交流的情况下,如果验证码可以实现将可以完全实现自动抢票:

–1>验证码有一定规律和数量,可以利用脚本获取所有图片,并加上相应标签

–2>将页面的文字和标签相匹配,再将图片进行相似度计算,对对应图片进行点击操作

–3>或是训练深度学习的图片识别模型,通过算法识别

browser = webdriver.Firefox()

browser.get(“https://kyfw.12306.cn/otn/login/init”)

browser.find_element_by_id(‘username’).clear()

browser.find_element_by_id(‘username’).send_keys(‘xxxxxxx’)

browser.find_element_by_id(‘password’).send_keys(‘xxxxxxx’)

time.sleep(10)try:

browser.find_element_by_id(‘loginSub’).click()except:

browser.find_element_by_class_name(‘touclick-bgimg touclick-reload touclick-reload-normal’).click()

time.sleep(15)

browser.find_element_by_id(‘loginSub’).click()#跳转到车票预定页面time.sleep(2)

clickReserve = browser.find_element_by_link_text(‘车票预订’).click()#出发地点和到达地点设置WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID,“fromStation”)))

jsf =‘var a = document.getElementById(“fromStation”);a.value = “BJP”‘browser.execute_script(jsf)

jst =‘var a = document.getElementById(“toStation”);a.value = “LZJ”‘browser.execute_script(jst)

js =“document.getElementById(‘train_date’).removeAttribute(‘readonly’)”browser.execute_script(js)

browser.find_element_by_id(‘train_date’).clear()

browser.find_element_by_id(‘train_date’).send_keys(‘2018-02-02’)

search = browser.find_element_by_id(‘query_ticket’).click()#对于时间,我一直觉得网站计算的时间和自己获取的时间差一秒左右,这个根据不同环境自己测试start_time =“Thu Jan 04 10:00:00 2018”#首先设置需要抢票的时间b =time.mktime(time.strptime(start_time,“%a %b %d %H:%M:%S %Y”))

print(time.strftime(“%a %b %d %H:%M:%S %Y”,time.localtime(b)) ) #此处是为了调试代码使用,可忽略,不影响使用a =float(b)-time.time() #利用自己设置的时间减去当前时间的时间戳time.sleep(a) #上一步骤得出的秒数就是需要等待抢票的时间browser.find_element_by_id(‘query_ticket’).click() #时间到了先点击查询刷新一下,以防找不到元素try:

WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID,“ticket_2400000Z550L”)))

ticket = browser.find_element_by_xpath(‘//tr[@id=”ticket_2400000Z550L”]/td[13]/a’).click()except:

browser.find_element_by_id(‘query_ticket’).click()

WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.ID,“ticket_250000K8880L”)))

ticket = browser.find_element_by_xpath(‘//tr[@id=”ticket_250000K8880L”]/td[13]/a’).click()“””

normalPassenger_8 数字表示该账号下的第几位,默认从0开始如果是第一个则为normalPassenger_0

“”“WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID, “normalPassenger_8″)))

browser.find_element_by_id(‘normalPassenger_8’).click()

s =Select(browser.find_element_by_id(‘seatType_1’))

s.select_by_value(‘6’)

browser.find_element_by_id(‘submitOrder_id’).click()

WebDriverWait(browser,10).until(EC.presence_of_element_located((By.ID,“qr_submit_id”)))

browser.find_element_by_link_text(‘提交订单’)#browser.find_element_by_id(‘qr_submit_id’).click()

作者:LGC247CG

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180114B0A9E300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券