前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >运用Python实现WordPress网站大规模自动化发布文章

运用Python实现WordPress网站大规模自动化发布文章

作者头像
Python中文社区
发布2018-01-31 12:10:54
3.2K0
发布2018-01-31 12:10:54
举报
文章被收录于专栏:Python中文社区Python中文社区

很多用WordPress建站的朋友都有这样的苦恼,网站建好了,没有时间自己写文章,慢慢就荒废了,还有的朋友在浏览器收集好多喜欢的博客网站地址,因为收集的网址太多太杂,从此也很少点开看。其实只要几行代码我们就可以完全利用Python和WordPress建一个属于自己的文章抓取站点。主要是运用python newspaper xmlrpc 模块编写实现网页爬虫,通过正则匹配爬取网页内容后,用xmlrpc自动发布到WordPress部署的网站。然后采用crond定时抓取。

第一部分:抓取目标页面的文章

代码语言:javascript
复制
#得到html的源码
def gethtml(url1):
    #伪装浏览器头部
    headers = {
       'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'
}

    req = urllib2.Request(
    url = url1,
    headers = headers
    )
    html = urllib2.urlopen(req).read()
    return html
#得到目标url源码
code1 = gethtml('https://www.baidu.com')#示例
#提取内容
content1 = re.findall('<h2 class="title"><a href="(.*)">(.*)</a></h2>',code1)#示例
#追加记录采集来的内容
f1 = open('contents1.txt','a+')
#读取txt中的内容
exist1 = f1.read()

第二部分:通过xmlrpc发送文章到WordPress

代码语言:javascript
复制
def sends():
    for i in range(len(content1)):
        u=content1[i][0]
        url='https://www.baidu.com'+u
        a=Article(url,language='zh')
        a.download()
        a.parse()
        dst=a.text
        title=a.title

        #链接WordPress,输入xmlrpc链接,后台账号密码
        wp = Client('http://www.python-cn.com/xmlrpc.php','username','password')
        post = WordPressPost()
        post.title = title
        post.content = dst
        post.post_status = 'publish'
        #发送到WordPress
        wp.call(NewPost(post))
        time.sleep(3)
        print 'posts updates'

最后,通过crontab定时运行程序,采集指定文章发送的WordPress

代码语言:javascript
复制
0 12 * * 2 /usr/bin/python /home/workspace/python-cn/python-cn.py
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-08-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python中文社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档