首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python爬取12306列车信息

    #!/usr/bin/env python #coding=utf8 #12306查票爬虫 import requests,json,sys #获取地址代码 #https://kyfw.12306.cn/otn/resources/js/framework/favorite_name.js url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9025' url_tmp = str(requests.get(url, verify=False).content, encoding='utf-8').replace("var station_names ='@", '').replace( "';", '') url_tmp = list(url_tmp.split('@')) def dizhi_code(dizhi): ''' 通过站点名字获取code ''' for i in url_tmp: if dizhi == i.split('|')[1]: return i.split('|')[2] def code_dizhi(code): ''' 通过code获取站点名字 ''' # print (url_tmp) for i in url_tmp: if code == i.split('|')[2]: return i.split('|')[1] def get_lieche(start_che,end_che,date): start_che=dizhi_code(start_che) end_che=dizhi_code(end_che) # print (start_che,end_che) try: url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=%s&leftTicketDTO.from_station=%s&leftTicketDTO.to_station=%s&purpose_codes=ADULT' %(date,start_che,end_che) # print (url) data = json.loads(requests.get(url, verify=False).content) except Exception as e: print("获取数据失败,可能网络错误或者请求太频繁",e) sys.exit(2) chuli_data=[] for i in data['data']['result']: list_che=list(i.strip('|').split('|')) if list_che[0]=="23:00-06:00系统维护时间" or list_che[0]=="预订" : #时间 列车班号 始发站 终点站 始发时间 终点时间 一共时间 商务座 一等座 二等座 软卧 硬卧 chuli_data.append((che_time,list_che[2],code_dizhi(list_che[3]),code_dizhi(list_che[4]),list_che[7],list_che[8],list_che[9],list_che[-4],list_che[-5],list_che[-6],list_che[-13],list_che[-8],list_che[-7])) else: chuli_data.append((che_time, list_che[3], code_dizhi(list_che[4]), code_dizhi(list_che[5]), list_che[8], list_che[9], list_che[10], list_che[-4], list_che[-5], list_che[-6], list_che[-13],list_che[-8],

    01

    Google Hacking 搜索引擎攻击与防范

    Google Hacking,有时也会被称为 Google dorking,是一种利用谷歌搜索的高级使用方式进行信息收集的技术。这个概念最早在2000年由黑客 Johnny Long 提出并推广,一系列关于 Google Hacking 的内容被他写在了《Google Hacking For Penetration Testers》一书中,并受到媒体和大众的关注。在 DEFCON 13的演讲上,Johnny 创造了 “Googledork" 这个词,“Googledork" 指的是“被 Google 透露了信息的愚蠢、无能的人们”。这是为了引起人们注意到,这些信息能被搜索到并不是 Google 的问题,而是由用户或用户安装程序时无意识的错误配置造成的。随着时间的推移,“dork" 这个词成为了“定位敏感信息的搜索”这个行为的简称。

    01

    妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池

    很多时候,在爬取没有登录的情况下,我们也可以访问一部分页面或请求一些接口,因为毕竟网站本身需要做SEO,不会对所有页面都设置登录限制。 但是,不登录直接爬取会有一些弊端,弊端主要有以下两点。 设置了登录限制的页面无法爬取。如某论坛设置了登录才可查看资源,某博客设置了登录才可查看全文等,这些页面都需要登录账号才可以查看和爬取。 一些页面和接口虽然可以直接请求,但是请求一旦频繁,访问就容易被限制或者IP直接被封,但是登录之后就不会出现这样的问题,因此登录之后被反爬的可能性更低。 下面我们就第二种情况做一个简

    05
    领券