前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python教程7--爬取博客访问量

python教程7--爬取博客访问量

作者头像
IT云清
发布2019-01-22 15:11:03
3060
发布2019-01-22 15:11:03
举报
文章被收录于专栏:IT云清IT云清IT云清

1.引入需要的库

pip install requests pip install pyquery

2.观察博客页面,找到目标字段

这里写图片描述
这里写图片描述

3.代码实现

import requests
from pyquery import PyQuery as pq

def myCsdn():
    print('aaa')
    html = pq('https://blog.csdn.net/weixin_39800144')
    list = html.find(".grade-box dl").items()
    for l in list:
        hanzi = l.find("dt").text()
        if(hanzi == '访问:'):
            print(l.find("dt").text() + l.find("dd").attr.title)
        elif(hanzi == '等级:'):
            dengji = l.find("dd").find("a").attr.title
            dengji2 = dengji.split(',')
            print(l.find("dt").text() + dengji2[0])
        else:
            print(l.find("dt").text() + l.find("dd").text())


myCsdn()

查看结果

aaa
等级:5级
访问:200124
积分:4654
排名:8939
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年09月01日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.引入需要的库
  • 2.观察博客页面,找到目标字段
  • 3.代码实现
  • 查看结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档