前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 爬虫 豆瓣图书TOP250

python 爬虫 豆瓣图书TOP250

作者头像
用户5760343
发布2022-01-10 08:11:26
3250
发布2022-01-10 08:11:26
举报
文章被收录于专栏:sktj

import requests from bs4 import BeautifulSoup

headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3298.4 Safari/537.36' } def gettop250(url): html=requests.get(url,headers=headers) b=BeautifulSoup(html.text,'lxml') trs = b.select('tr.item') for tr in trs: aa=tr.select('td>a') atitle=tr.select('div.pl2>a') aritle=tr.select('p.pl') inq=tr.select('span.inq') print(aa[0].get("href")) print(aa[0].select("img")[0].get("src")) print(atitle[0].get('title')) print(aritle[0].get_text()) if len(inq)>=1:print(inq[0].get_text()) for i in range(0,250,25): gettop250("https://book.douban.com/top250?start={}".format(i))

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.05.13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档