前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >写日报的代码

写日报的代码

原创
作者头像
用户4393181
发布2021-12-22 14:32:08
1.6K0
发布2021-12-22 14:32:08
举报
文章被收录于专栏:python学习代码python学习代码

coding: utf-8

代码语言:javascript
复制
from lxml import etree
import requests,urllib
from requests.models import Response
import  xlsxwriter
import datetime
from openpyxl import load_workbook
import re
from selenium import webdriver

网站888文章更新函数

def drinks888(url):

代码语言:txt
复制
datas=[]        
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
html2=requ_html("http://www.drinks888.com/news/53/2.html")     
代码语言:txt
复制
url=url.split('/news')
代码语言:txt
复制
# 第一页的三条数据
代码语言:txt
复制
title=html.xpath('//div[@class="news_main2"]/dl[position()>1]/dd/h3/a/text()')
代码语言:txt
复制
urls=html.xpath('//div[@class="news_main2"]/dl[position()>1]/dd/h3/a/@href')
代码语言:txt
复制
for i in range(0,3):
代码语言:txt
复制
    datas.append(url[0]+urls[i])
代码语言:txt
复制
    datas.append(title[i].strip())
代码语言:txt
复制
    # 第二页的两条
代码语言:txt
复制
title2=html2.xpath('//div[@class="news_main2"]/dl/dd/h3/a/text()')
代码语言:txt
复制
urls2=html2.xpath('//div[@class="news_main2"]/dl/dd/h3/a/@href')
代码语言:txt
复制
for i in range(0,2):
代码语言:txt
复制
    datas.append(url[0]+urls2[i])
代码语言:txt
复制
    datas.append(title2[i].strip())
代码语言:txt
复制
wb = load_workbook(r'C:\Users\Administrator\Desktop\唐富\唐富\5月工作表\各类长尾词统计.xlsx')
代码语言:txt
复制
wbs=wb['所有文章更新链接']
代码语言:txt
复制
n=wbs.max_row+2
代码语言:txt
复制
for i in range(0,10,2):
代码语言:txt
复制
    wbs['D{}'.format(n)] = datas[i]
代码语言:txt
复制
    wbs['E{}'.format(n)] = datas[i+1]
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
wb.save(r'C:\Users\Administrator\Desktop\唐富\唐富\5月工作表\各类长尾词统计.xlsx')   
代码语言:txt
复制
print('链接已写入各类关键词表中')     
代码语言:txt
复制
return datas

网站999文章更新的函数

def drinks999(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/news')
代码语言:txt
复制
list_p=html.xpath('//dl[@class="dl_220"]/dd/a/text()')
代码语言:txt
复制
list_url=html.xpath('//dl[@class="dl_220"]/dd/a/@href')
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    title_text=list_p[i].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
    url_href=url[0]+list_url[i]
代码语言:txt
复制
    # worksheet.write(9+i,2,url_href)
代码语言:txt
复制
    # worksheet.write(9+i,3,title_text)
代码语言:txt
复制
    datas.append(url_href)
代码语言:txt
复制
    datas.append(title_text.strip())
代码语言:txt
复制
return datas

网站aaa的更新函数

def drinksaaa(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_p=html.xpath('//ul[@class="fc_pro"]/li/a/h3/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//ul[@class="fc_pro"]/li/a/@href')[0]
代码语言:txt
复制
# url_href=url[0]+list_url
代码语言:txt
复制
# worksheet.write(15,2,list_p)
代码语言:txt
复制
# worksheet.write(15,3,url_href)
代码语言:txt
复制
# print(list_p)
代码语言:txt
复制
# print(url_href)
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_p.strip())
代码语言:txt
复制
return datas

网站bbb、ccc、ddd、eee、fff、kkk/mmm文章更新函数

def drinksbcdef(url):

代码语言:txt
复制
# header={
代码语言:txt
复制
#     'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36',
代码语言:txt
复制
#     'Cookie':'bdshare_firstime=1574388395758; yjs_id=aHR0cDovL3d3dy5kcmlua3NiYmIuY29tL2p3dGNiYmIwMjgvfDE1ODc2MjMzNjkyNjU; DedeUserID=1; DedeUserID__ckMd5=9880aa35c1f9b840; DedeLoginTime=1597627802; DedeLoginTime__ckMd5=0ae3c362e99a6e1f; Hm_lvt_8b1432e8c92af2a6596d7f512dabf0f0=1597281289,1597367738,1597628086,1597657062; Hm_lpvt_8b1432e8c92af2a6596d7f512dabf0f0=1597657062'
代码语言:txt
复制
# }
代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
# print(html)    
代码语言:txt
复制
list_p=html.xpath('//div[@class="txt"]/h2/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_url=url[0]+html.xpath('//div[@class="txt"]/h2/a/@href')[0]       
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_p.strip())
代码语言:txt
复制
return datas    

网站qqq文章更新函数

def drinksqqq(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_title=html.xpath("//div[@class='news_con']/dl/dt/a/text()")[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath("//div[@class='news_con']/dl/dt/a/@href")[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
# print(list_url)
代码语言:txt
复制
# print(list_title.strip())
代码语言:txt
复制
return datas

网站rrr更新函数

def drinksrrr(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_title=html.xpath('//ul[@class="cpshow"]/li/h4/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//ul[@class="cpshow"]/li/h4/a/@href')[0]
代码语言:txt
复制
# print(list_title)
代码语言:txt
复制
# print(list_url)
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站sss、ggg更新函数

def drinkssss(url):

代码语言:txt
复制
datas=[]    
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_title=html.xpath('//div[@class="agent_con"]/dl/dd/h4/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//div[@class="agent_con"]/dl/dd/h4/a/@href')[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站hhh/nnn更新函数

def drinkshhh(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_title=html.xpath('//div[@class="VieList"]/h3/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//div[@class="VieList"]/h3/a/@href')[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站jjj更新函数

def drinksjjj(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')
代码语言:txt
复制
list_title=html.xpath('//div[@class="pro_main"]/dl/dd/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//div[@class="pro_main"]/dl/dd/a/@href')[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站lll函数

def drinkslll(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a')    
代码语言:txt
复制
list_title=html.xpath('//div[@class="agent_con"]/dl/dd/a/text()')[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath('//div[@class="agent_con"]/dl/dd/a/@href')[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站ooo更新函数

def drinksooo(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
url=url.split('/a') 
代码语言:txt
复制
list_title=html.xpath("//div[@class='news_con']/dl/dd/span/a/text()")[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath("//div[@class='news_con']/dl/dd/span/a/@href")[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

网站ppp函数

def drinksppp(url):

代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
datas=[]
代码语言:txt
复制
url=url.split('/a') 
代码语言:txt
复制
list_title=html.xpath("//dl[@class='pd_list_dl']/dd/a/text()")[0].encode('ISO-8859-1').decode('UTF-8')
代码语言:txt
复制
list_url=url[0]+html.xpath("//dl[@class='pd_list_dl']/dd/a/@href")[0]
代码语言:txt
复制
datas.append(list_url)
代码语言:txt
复制
datas.append(list_title.strip())
代码语言:txt
复制
return datas

通用

def requ_html(url):

代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
代码语言:txt
复制
}
代码语言:txt
复制
res=requests.get(url,headers=headers)
代码语言:txt
复制
html=etree.HTML(res.text)
代码语言:txt
复制
return html

搜狐函数

def souhu(url):

代码语言:txt
复制
datas=[]   
代码语言:txt
复制
# 第二个搜狐号
代码语言:txt
复制
html2=requ_html(url)
代码语言:txt
复制
title2=html2.xpath('//ul/li[position()<6]/article/div/h4/a/text()')
代码语言:txt
复制
urls2=html2.xpath('//ul/li[position()<6]/article/div/h4/a/@href')
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    datas.append('https:'+urls2[i])
代码语言:txt
复制
    datas.append(title2[i].strip())   
代码语言:txt
复制
return datas

博客//*@id="module_928"/div2/div1/div2/div1/p1/span2/a

def boke(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)
代码语言:txt
复制
title=html.xpath('//div[@class="articleList"]/div[position()<6]/p/span/a/text()')
代码语言:txt
复制
urls=html.xpath('//div[@class="articleList"]/div[position()<6]/p/span/a/@href')
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    datas.append(urls[i])
代码语言:txt
复制
    datas.append(title[i].encode('ISO-8859-1').decode('UTF-8'))
代码语言:txt
复制
return datas

创头条

def chuangtout(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
html=requ_html(url)      
代码语言:txt
复制
urls=html.xpath('//h2/a/@href')    
代码语言:txt
复制
title=html.xpath('//h2/a/text()')
代码语言:txt
复制
for i in range(0,5):    
代码语言:txt
复制
    datas.append("http://www.ctoutiao.com"+urls[i].replace('\\','').replace('"',''))
代码语言:txt
复制
    n=title[i].replace(r'\r\n','').encode('utf-8').decode('unicode_escape').strip()
代码语言:txt
复制
    datas.append(n.strip())
代码语言:txt
复制
return datas

快传号

def kuaichuang():

代码语言:txt
复制
url='https://www.360kuai.com/mob/api/getgzh?callback=jQuery1910931088931784106_1622702058309&scheme=https&pg=1&sign=360_57c3bbd1&u=0f0d2fb283622d320adb4f56433f6c5e&n=10&sqid=&gzh=155938358&djsource=&tmprtp=&tj_url=&refer_scene=so_1&scene=61&f=jsonp&_=1622702058310'
代码语言:txt
复制
# url='https://www.360kuai.com/mob/api/getgzh?callback=jQuery191023346830254345963_1622705544780&scheme=https&pg=1&sign=look&u=0f0d2fb283622d320adb4f56433f6c5e&n=10&sqid=&gzh=3176116568&djsource=&tmprtp=&tj_url=&refer_scene=&scene=61&f=jsonp&_=1622705544781'
代码语言:txt
复制
datas=[]
代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
代码语言:txt
复制
res=requests.get(url,headers=headers)
代码语言:txt
复制
# html=etree.HTML(res.text)
代码语言:txt
复制
# title=html.xpath('//h3/a/text()')
代码语言:txt
复制
# links = html.xpath('//h3/a/@href')
代码语言:txt
复制
title=re.findall('"t":"(.*?)","c"',res.text)
代码语言:txt
复制
ucheck=re.findall('"gnid":"(.*?)"}',res.text)
代码语言:txt
复制
for i in range(0,10):
代码语言:txt
复制
    datas.append('https://www.360kuai.com/pc/'+ucheck[i])
代码语言:txt
复制
    datas.append(title[i].encode('utf-8').decode('unicode_escape'))
代码语言:txt
复制
return datas

818同城发布

def get_818(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
headers={
代码语言:txt
复制
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
代码语言:txt
复制
        }
代码语言:txt
复制
# s = requests.session() #建立一个Session
代码语言:txt
复制
# form_data = {   
代码语言:txt
复制
#     '__VIEWSTATE': '/wEPDwUKLTk4NDU4OTMzMWRk2n6a8smWQwShiX7p3Dw0lcMKWtXllwxr+A6O7EuLWfE=',
代码语言:txt
复制
#     '__VIEWSTATEGENERATOR': 'D399C246',
代码语言:txt
复制
#     'username': 'a463459227',    
代码语言:txt
复制
#     'userpassword':'463459227',
代码语言:txt
复制
#     'Button1': '登录',
代码语言:txt
复制
# }
代码语言:txt
复制
# session = requests.session()
代码语言:txt
复制
# response = session.post(url,headers=headers,data=form_data) #session登录网站
代码语言:txt
复制
url="http://www.818u.com/s447889/"
代码语言:txt
复制
response = requests.get(url,headers=headers) #session浏览页面
代码语言:txt
复制
html=etree.HTML(response.text)
代码语言:txt
复制
title=html.xpath('/html/body/div/div[4]/div/div[4]/div[2]/div[1]/ul/li/a/text()')
代码语言:txt
复制
urls=html.xpath('//html/body/div/div[4]/div/div[4]/div[2]/div[1]/ul/li/a/@href')
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    datas.append('http://www.818u.com'+urls[i])
代码语言:txt
复制
    datas.append(title[i])
代码语言:txt
复制
return datas

百姓网

def get_baixing():

代码语言:txt
复制
datas=[]
代码语言:txt
复制
url='https://www.baixing.com/u/92147482/?src=vad_listing_7'
代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
代码语言:txt
复制
res=requests.get(url,headers=headers)    
代码语言:txt
复制
html=etree.HTML(res.text)    
代码语言:txt
复制
title=html.xpath('//ul[@class="list-ad-items"]/li[position()<6]/div/div[1]/a/text()')
代码语言:txt
复制
baixing_url=html.xpath('//ul[@class="list-ad-items"]/li[position()<6]/div/div[1]/a/@href')
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    datas.append(baixing_url[i].replace('?from=',''))
代码语言:txt
复制
    datas.append(title[i])
代码语言:txt
复制
return datas 

知乎

def zhihu():

代码语言:txt
复制
datas=[]
代码语言:txt
复制
url='https://www.zhihu.com/people/ding-ni-ge-fei-68-18/posts'
代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
代码语言:txt
复制
}
代码语言:txt
复制
res=requests.get(url,headers=headers)
代码语言:txt
复制
html=res.text
代码语言:txt
复制
url_list=re.search('<script id="js-initialData" type="text/json">(.*?)</script>',html)[0]
代码语言:txt
复制
# title=html.xpath('//h2[@class="ContentItem-title"][position()<6]/a/text()')
代码语言:txt
复制
urls=re.findall('"author".*?},"url":"(.*?)","commentPermission"',url_list)
代码语言:txt
复制
title_list=re.findall('"linkbox":{.*?},"title":"(.*?)","voting',url_list)
代码语言:txt
复制
# print(t[0].encode('utf8').decode('unicode_escape'))
代码语言:txt
复制
for i in range(5,10):
代码语言:txt
复制
    datas.append(urls[i].encode('utf-8').decode('unicode-escape'))
代码语言:txt
复制
    datas.append(title_list[i])
代码语言:txt
复制
return datas    

百家号

def baijiahao2():

代码语言:txt
复制
option = webdriver.ChromeOptions()
代码语言:txt
复制
option.add_argument("headless")
代码语言:txt
复制
url='https://author.baidu.com/home?from=bjh_article&app_id=1646805710008842'
代码语言:txt
复制
driver=webdriver.Chrome(r'C:\Program Files\Google\Chrome\Application\chromedriver.exe',options=option)
代码语言:txt
复制
print('打开浏览器,打开登录')
代码语言:txt
复制
datas=[]
代码语言:txt
复制
driver.get(url)
代码语言:txt
复制
baijia_drivers=driver.find_elements_by_xpath('//div[starts-with(@url,"https://baijiahao.baidu.com/s")]')
代码语言:txt
复制
for b in baijia_drivers:
代码语言:txt
复制
    datas.append(b.get_attribute("url"))
代码语言:txt
复制
    datas.append(b.get_attribute('title'))
代码语言:txt
复制
print('抓取完毕')
代码语言:txt
复制
return datas  

def baijiahao():

代码语言:txt
复制
datas=[]
代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36', 
代码语言:txt
复制
}
代码语言:txt
复制
urls='https://mbd.baidu.com/webpage?tab=main&num=10&uk=zY-_SEXGkAnbinLaoiX9uw&source=pc&type=newhome&action=dynamic&format=jsonp&otherext=h5_20210512150247&Tenger-Mhor=3729859865&callback=__jsonp01621232675252'
代码语言:txt
复制
# urls='https://mbd.baidu.com/webpage?tab=main&num=10&uk=0sjX3ZhmuoiDKUlCa0Sd2w&source=pc&type=newhome&action=dynamic&format=jsonp&otherext=h5_20211102104358&Tenger-Mhor=3132920746&callback=__jsonp01635838632934'
代码语言:txt
复制
# res=requests.get(urls,headers=headers)
代码语言:txt
复制
# res=urllib.request.Request(urls)
代码语言:txt
复制
cont= urllib.request.urlopen(urls).read()
代码语言:txt
复制
with open('baidu.txt',"wb") as f:
代码语言:txt
复制
# 写文件用bytes而不是str,所以要转码
代码语言:txt
复制
    f.write(cont)
代码语言:txt
复制
# with open('baidu.txt','r',encoding='utf-8') as ff:
代码语言:txt
复制
#     jstexts=ff.read()
代码语言:txt
复制
print(cont)
代码语言:txt
复制
# url=re.findall(r'id=(\d+)',res.text)
代码语言:txt
复制
# print(res.text)
代码语言:txt
复制
# title=re.findall(r'"title":"(.*?)",',res.text)
代码语言:txt
复制
# # print(title)
代码语言:txt
复制
# for i in range(0,5):
代码语言:txt
复制
#     datas.append('https://baijiahao.baidu.com/s?id='+url[i])
代码语言:txt
复制
#     datas.append(title[i].encode('utf-8').decode('unicode_escape'))
代码语言:txt
复制
# return datas

#b站栏目文章抓取

def bili_cont():

代码语言:txt
复制
datas=[]
代码语言:txt
复制
url='https://api.bilibili.com/x/space/article?mid=702710400&pn=1&ps=12&sort=publish_time&jsonp=jsonp'
代码语言:txt
复制
res=requests.get(url)
代码语言:txt
复制
html=res.text
代码语言:txt
复制
title=re.findall(r'日常.*?"title":"(\S+?)"',html)
代码语言:txt
复制
url_id=re.findall(r'{"id":(\d+),"category',html)
代码语言:txt
复制
for i in range(0,5):
代码语言:txt
复制
    datas.append('https://www.bilibili.com/read/cv{}'.format(url_id[i]))
代码语言:txt
复制
    datas.append(title[i])
代码语言:txt
复制
return datas

def meipian(url):

代码语言:txt
复制
datas=[]
代码语言:txt
复制
headers={
代码语言:txt
复制
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
代码语言:txt
复制
res=requests.get(url,headers=headers)
代码语言:txt
复制
html=etree.HTML(res.text)
代码语言:txt
复制
title=html.xpath('//h3/a/text()')
代码语言:txt
复制
links = html.xpath('//h3/a/@href')
代码语言:txt
复制
for t in range(0,10):
代码语言:txt
复制
    datas.append(links[t])
代码语言:txt
复制
    datas.append(title[t])
代码语言:txt
复制
return datas

主函数

def main():

代码语言:txt
复制
now_time =datetime.datetime.now().strftime('%Y-%m-%d')
代码语言:txt
复制
workbook = xlsxwriter.Workbook("C:/Users/Administrator/Desktop/唐富/唐富/5月工作表/{}唐富工作日报.xlsx".format(now_time)) # 创建excel
代码语言:txt
复制
worksheet = workbook.add_worksheet("first_sheet") # 创建sheet
代码语言:txt
复制
merge_format = workbook.add_format({
代码语言:txt
复制
'bold': True,
代码语言:txt
复制
"align": "center",  # 对齐方式
代码语言:txt
复制
"valign": "vcenter",  # 字体对齐方式
代码语言:txt
复制
"font_color": "red"  })
代码语言:txt
复制
style=workbook.add_format({
代码语言:txt
复制
"font_color": "red"     })
代码语言:txt
复制
worksheet.merge_range('B3:C3','网站文章更新',merge_format)
代码语言:txt
复制
# worksheet.merge_range('B3:C4', '网站文章更新', merge_format)
代码语言:txt
复制
# worksheet.write(2, 1, '网站文章更新')
代码语言:txt
复制
worksheet.write(3, 1, '网站888文章更新',style)
代码语言:txt
复制
worksheet.write(3, 3, '百家号',style)
代码语言:txt
复制
worksheet.write(9, 1, '网站999文章更新',style)
代码语言:txt
复制
worksheet.write(9, 3, '创头条',style)
代码语言:txt
复制
# 设置宽度
代码语言:txt
复制
worksheet.set_column(1,4, 45)
代码语言:txt
复制
# worksheet.write(10, 2,'url')
代码语言:txt
复制
# worksheet.write(10, 3,'title')
代码语言:txt
复制
worksheet.write(15, 1, '其他网站文章更新',style)
代码语言:txt
复制
worksheet.write(34, 1, '818美篇博客',style)
代码语言:txt
复制
# worksheet.write(16, 1,'url')
代码语言:txt
复制
# worksheet.write(16, 2,'title')
代码语言:txt
复制
# 网站888文章
代码语言:txt
复制
print('网站888文章开始')
代码语言:txt
复制
datas=drinks888("http://www.drinks888.com/news/53/1.html")
代码语言:txt
复制
# 激活 worksheet
代码语言:txt
复制
n=4
代码语言:txt
复制
for i in range(0,10,2):
代码语言:txt
复制
    worksheet.write(n,1,datas[i])
代码语言:txt
复制
    worksheet.write(n,2,datas[i+1])
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
print('网站999文章开始')
代码语言:txt
复制
datas=drinks999('http://www.drinks999.com/news')
代码语言:txt
复制
n=10  
代码语言:txt
复制
for i in range(0,10,2):   
代码语言:txt
复制
    worksheet.write(n,1,datas[i])
代码语言:txt
复制
    worksheet.write(n,2,datas[i+1])
代码语言:txt
复制
    n=n+1   
代码语言:txt
复制
print('网站aaa文章开始')
代码语言:txt
复制
datas_aaa=drinksaaa("http://www.drinksaaa.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(16,1,datas_aaa[0])
代码语言:txt
复制
worksheet.write(16,2,datas_aaa[1])
代码语言:txt
复制
print('网站bbb更新开始')
代码语言:txt
复制
datas_bbb=drinksbcdef("http://www.drinksbbb.com/a/xinwenzixun/")
代码语言:txt
复制
worksheet.write(17,1,datas_bbb[0])
代码语言:txt
复制
worksheet.write(17,2,datas_bbb[1])
代码语言:txt
复制
print('网站ccc更新开始')
代码语言:txt
复制
datas_ccc=drinksbcdef("http://www.drinksccc.com/a/xingyezixun")
代码语言:txt
复制
worksheet.write(18,1,datas_ccc[0])
代码语言:txt
复制
worksheet.write(18,2,datas_ccc[1])
代码语言:txt
复制
print('网站ddd更新开始')
代码语言:txt
复制
datas_ddd=drinksbcdef("http://www.drinksddd.com/a/xingyezixun")
代码语言:txt
复制
worksheet.write(19,1,datas_ddd[0])
代码语言:txt
复制
worksheet.write(19,2,datas_ddd[1])
代码语言:txt
复制
print('网站eee更新开始')
代码语言:txt
复制
datas_eee=drinksbcdef("http://www.drinkseee.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(20,1,datas_eee[0])
代码语言:txt
复制
worksheet.write(20,2,datas_eee[1])
代码语言:txt
复制
print('网站fff更新开始')
代码语言:txt
复制
datas_fff=drinksbcdef("http://www.drinksfff.com/a/xingyezixun")
代码语言:txt
复制
worksheet.write(21,1,datas_fff[0])
代码语言:txt
复制
worksheet.write(21,2,datas_fff[1])
代码语言:txt
复制
print('网站ggg更新开始')
代码语言:txt
复制
datas_ggg=drinkslll("http://www.drinksggg.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(22,1,datas_ggg[0])
代码语言:txt
复制
worksheet.write(22,2,datas_ggg[1])
代码语言:txt
复制
print('网站hhh更新开始')
代码语言:txt
复制
datas_hhh=drinkshhh("http://www.drinkshhh.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(23,1,datas_hhh[0])
代码语言:txt
复制
worksheet.write(23,2,datas_hhh[1])
代码语言:txt
复制
print('网站jjj更新开始')
代码语言:txt
复制
datas_jjj=drinksjjj("http://www.drinksjjj.com/news")
代码语言:txt
复制
worksheet.write(24,1,datas_jjj[0])
代码语言:txt
复制
worksheet.write(24,2,datas_jjj[1])
代码语言:txt
复制
print('网站kkk更新开始')
代码语言:txt
复制
datas_kkk=drinksbcdef("http://www.drinkskkk.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(25,1,datas_kkk[0])
代码语言:txt
复制
worksheet.write(25,2,datas_kkk[1])
代码语言:txt
复制
print('网站mmm更新开始')
代码语言:txt
复制
datas_mmm=drinksbcdef("http://www.drinksmmm.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(26,1,datas_mmm[0])
代码语言:txt
复制
worksheet.write(26,2,datas_mmm[1])
代码语言:txt
复制
print('网站nnn更新开始')
代码语言:txt
复制
datas_nnn=drinkshhh("http://www.drinksnnn.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(27,1,datas_nnn[0])
代码语言:txt
复制
worksheet.write(27,2,datas_nnn[1])
代码语言:txt
复制
print('网站ooo更新开始')
代码语言:txt
复制
datas_ooo=drinksooo("http://www.drinksooo.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(28,1,datas_ooo[0])
代码语言:txt
复制
worksheet.write(28,2,datas_ooo[1])
代码语言:txt
复制
print('网站ppp更新开始')
代码语言:txt
复制
datas_ppp=drinksppp("http://www.drinksppp.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(29,1,datas_ppp[0])
代码语言:txt
复制
worksheet.write(29,2,datas_ppp[1])
代码语言:txt
复制
print('网站qqq更新开始')
代码语言:txt
复制
datas_qqq=drinksqqq("http://www.drinksqqq.com/news")
代码语言:txt
复制
worksheet.write(30,1,datas_qqq[0])
代码语言:txt
复制
worksheet.write(30,2,datas_qqq[1])
代码语言:txt
复制
print('网站rrr更新开始')
代码语言:txt
复制
datas_rrr=drinksrrr("http://www.drinksrrr.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(31,1,datas_rrr[0])
代码语言:txt
复制
worksheet.write(31,2,datas_rrr[1])
代码语言:txt
复制
print('网站sss更新开始')
代码语言:txt
复制
datas_sss=drinkssss("http://www.drinkssss.com/a/xinwenzhongxin")
代码语言:txt
复制
worksheet.write(32,1,datas_sss[0])
代码语言:txt
复制
worksheet.write(32,2,datas_sss[1])
代码语言:txt
复制
print('网站lll更新开始')
代码语言:txt
复制
datas_lll=drinkslll("http://www.drinkslll.com/a/xinwenzixun")
代码语言:txt
复制
worksheet.write(33,1,datas_lll[0])
代码语言:txt
复制
worksheet.write(33,2,datas_lll[1])
代码语言:txt
复制
print('818替代搜狐开始')
代码语言:txt
复制
datas=get_818('http://www.818u.com/s447889/')
代码语言:txt
复制
n=35  
代码语言:txt
复制
for i in range(0,10,2):   
代码语言:txt
复制
    worksheet.write(n,1,datas[i])
代码语言:txt
复制
    worksheet.write(n,2,datas[i+1])
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
# 每篇
代码语言:txt
复制
print('每篇文章抓取开始')
代码语言:txt
复制
datas=meipian('https://www.meipian.cn/c/283140641')
代码语言:txt
复制
n=40
代码语言:txt
复制
for i in range(0,20,2):   
代码语言:txt
复制
    worksheet.write(n,1,datas[i])
代码语言:txt
复制
    worksheet.write(n,2,datas[i+1])
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
print('boke开始')
代码语言:txt
复制
# 搜狐
代码语言:txt
复制
# datas=souhu("https://mp.sohu.com/profile?xpt=NTU0MmJiMDgtYzMxNC00MzRjLWIxOWUtNTdmMzk1MDBhZDg1&_f=index_pagemp_2&spm=smpc.content.author.3.159825042146246R1zHx")
代码语言:txt
复制
datas=boke('http://blog.sina.com.cn/s/articlelist_5226711056_0_1.html')
代码语言:txt
复制
n=50
代码语言:txt
复制
for i in range(0,10,2):
代码语言:txt
复制
    worksheet.write(n,1,datas[i])
代码语言:txt
复制
    worksheet.write(n,2,datas[i+1])  
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
# 创头条
代码语言:txt
复制
print('创头条开始')
代码语言:txt
复制
datas=chuangtout("http://www.ctoutiao.com/ajax_new/ajax_data.php?page=newCompany&act=getPosts&uid=1729092&type=getPosts&pageno=1")
代码语言:txt
复制
n=10
代码语言:txt
复制
for i in range(0,10,2):
代码语言:txt
复制
    worksheet.write(n,3,datas[i])
代码语言:txt
复制
    worksheet.write(n,4,datas[i+1])  
代码语言:txt
复制
    n=n+1
代码语言:txt
复制
# 百家号发布
代码语言:txt
复制
print('百家号开始')    
代码语言:txt
复制
datas=baijiahao2()  
代码语言:txt
复制
n=4
代码语言:txt
复制
for i in range(0,10,2):
代码语言:txt
复制
    worksheet.write(n,3,datas[i])
代码语言:txt
复制
    worksheet.write(n,4,datas[i+1])  
代码语言:txt
复制
    n=n+1 
代码语言:txt
复制
workbook.close()  # 关闭excel写入
代码语言:txt
复制
print('日报已经写完了')

main()

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • coding: utf-8
  • 网站888文章更新函数
  • 网站999文章更新的函数
  • 网站aaa的更新函数
  • 网站bbb、ccc、ddd、eee、fff、kkk/mmm文章更新函数
  • 网站qqq文章更新函数
  • 网站rrr更新函数
  • 网站sss、ggg更新函数
  • 网站hhh/nnn更新函数
  • 网站jjj更新函数
  • 网站lll函数
  • 网站ooo更新函数
  • 网站ppp函数
  • 通用
  • 搜狐函数
  • 博客//*@id="module_928"/div2/div1/div2/div1/p1/span2/a
  • 创头条
  • 快传号
  • 818同城发布
  • 百姓网
  • 知乎
  • 百家号
  • 主函数
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档