今
日
鸡
汤
非知之难,行之为难;非行之难,终之斯难。
大家好,我是皮皮。
一、前言
前几天在Python白银交流群【上海新年人】问了一个Python网络爬虫文字乱码的问题。代码如下:
url = 'https://www.fwsir.com/Article/html/Article_20230101085126_2180223.html'
heades = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
r = requests.get(url=url,headers=heades).text
r.encode('utf-8')
soup = BeautifulSoup(r,'html.parser')
s1 = soup.select('div.content>p')
for i in s1:
print(i.get_text())
二、实现过程
这个问题其实很常见,之前的文章里边也有写过多次了,这里【甯同学】给了一个提示:如下所示:
【磐奚鸟】给出了实战截图,上述代码确实好使。
后来【瑜亮老师】也补充了下爬虫知识,如下图所示:
顺利地解决了粉丝的问题。
领取专属 10元无门槛券
私享最新 技术干货