前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python可以做哪些好玩的事之自动刷票1.分析2.小试牛刀(代码基于Python 2.7)

Python可以做哪些好玩的事之自动刷票1.分析2.小试牛刀(代码基于Python 2.7)

作者头像
Python攻城狮
发布2018-08-23 11:56:36
1.5K0
发布2018-08-23 11:56:36
举报
文章被收录于专栏:Python攻城狮

目标网站:http://best.zhaopin.com/?sid=121128100&site=sou

1.分析

  • 先手动投票查看网页提交的请求

点击投票网页提交的请求

投票成功返回的json数据,可以看到是result:1

为公司投票时提交的参数


点击'为我点赞'网页提交的请求

点赞时提交的参数

通过分析可以看到网页实际上并没有针对同一IP的投票进行限制,所以不需要进行使用代理IP,但是为了使我们的代码更加符合常规网站的对同一IP限制投票的机制,所以这里抓取一个代理IP的网站进行点击投票

提供不错几个的短期代理IP网站

但是,这些免费开放代理一般会有很多人都在使用,而且代理有寿命短,速度慢,匿名度不高,HTTP/HTTPS支持不稳定等缺点(免费没好货)。

查看网页结构每一个代理IP和端口都在一个<td></td>标签中,我们可以通过正则筛选出我们想要的结果

2.小试牛刀(代码基于Python 2.7)

代码语言:javascript
复制
#-*- coding:utf-8 -*-

import requests
import json
import re
import random
import sys
import time
import datetime  #处理日期和时间的标准库
import threading  #引入多线程
from random import choice  #choice() 方法返回一个列表,元组或字符串的随机项
from bs4 import BeautifulSoup
from fake_useragent import UserAgent #引入userAgent


def get_ip():
    '''获取代理IP'''
    url = 'http://www.xicidaili.com/nn'
    my_headers = {
        'Accept': 'text/html, application/xhtml+xml, application/xml;',
        'Accept-Encoding': 'gzip, deflate, sdch',
        'Accept-Language': 'zh-CN,zh;q=0.8',
        'Referer': 'http: // www.xicidaili.com/nn',
        'User-Agent': 'Mozilla / 5.0(Windows NT 6.1;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 45.0.2454.101Safari / 537.36'
    }
    r = requests.get(url,headers=my_headers)
    soup = BeautifulSoup(r.text,'html.parser')
    data = soup.find_all('td')

    #定义IP和端口Pattern规则
    ip_compile = re.compile(r'<td>(\d+\.\d+\.\d+\.\d+)</td>')  #匹配IP
    port_compile = re.compile(r'<td>(\d+)</td>')  #匹配端口
    ip = re.findall(ip_compile,str(data))    #获取所有IP
    port = re.findall(port_compile,str(data))  #获取所有端口
    z = [':'.join(i) for i in zip(ip,port)]  #列表生成式
    print z
    #组合IP和端口
    return z

# 设置user-agent列表,每次请求时,随机挑选一个user-agent
ua_list = UserAgent()
print ua_list.random

def get_url(url,code=0,ips=[]):
    '''
    投票
    如果因为代理IP已失效造成投票失败,则会自动换一个代理IP后继续投票
    :param code:
    :param ips:
    :return:
    '''
    try:
        ip = choice(ips)
    except:
        return False

    else:
        #指定IP
        proxies = {
            'http':ip
        }
        headers = {
            'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
            'Host': 'best.zhaopin.com',
            'Origin': 'https: // best.zhaopin.com',
            'Referer':'https//best.zhaopin.com/?sid=121128100&site=sou',
            # 'User-Agent':choice(ua_list)
            'User-Agent': ua_list.random
        }
        print ua_list.random

    try:
        data = {"bestid": "3713", "score": "5,5,5,5,5,5","source": "best",}

        result = requests.post(url=url,data=data, proxies=proxies,)  # 跳过证书的验证 verify=False
    except requests.exceptions.ConnectionError:
        print 'ConnectionError'
        if not ips:
            print 'ip 已失效'
            sys.exit()
        #删除不可用的代理IP
        if ip in ips:
            ips.remove(ip)
        #重新请求url
        get_url(url,code=0,ips=[])
    else:
        date = datetime.datetime.now().strftime('%H:%M:%S')
        # result.text() 投票成功显示1  失败显示0
        print u"第%s次 [%s] [%s]:投票%s (剩余可用代理IP数:%s)" % (code, date, ip, result.text, len(ips))

def get_num(num):
    #点赞的请求
    url1 = 'https://best.zhaopin.com/API/Vote.ashx'
    #投票的请求
    url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
    if num == 1:
        url=url1
        main(url)
    elif num == 2:
        url =url2
        main(url)
    else:
        print '您的输入有误,请重新输入!!!'
        num = int(raw_input('自主刷赞请选1,自动投票请选2:'))
        get_num(num)


def main(url):
    ips = []
    #xrange() 生成的是一个生成器
    for i in xrange(6000):
        # 每隔1000次重新获取一次最新的代理IP,每次可获取最新的100个代理IP
        if i % 1000 == 0:
            ips.extend(get_ip())
            print '--------------------------------------'
            print ips
        #启动线程,每隔1s产生一个线程,可通过控制时间加快投票速度
        t1 = threading.Thread(target=get_url,args=(url,i,ips))
        t1.start()
        time.sleep(1)  #time.sleep的最小单位是毫秒




if __name__ == '__main__':
    # #点赞的请求
    # url1 = 'https://best.zhaopin.com/API/Vote.ashx'
    # #投票的请求
    # url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
    print '欢迎使用自助刷票小工具QAQ'
    num = int(raw_input('自主刷赞请选1,自动投票请选2:'))
    get_num(num)
  • 运行程序

开启程序,可以看到每次投票的IP已不再是我们本机IP

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017.09.14 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.分析
  • 2.小试牛刀(代码基于Python 2.7)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档