前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python爬虫实战练习:爬取美团旅游景点评论数据

Python爬虫实战练习:爬取美团旅游景点评论数据

作者头像
松鼠爱吃饼干
发布2020-09-24 16:11:54
2.2K0
发布2020-09-24 16:11:54
举报
文章被收录于专栏:Python分享Python分享

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

今年的国庆节还有半个月就要来了,相信很多的小伙伴还是非常期待这个小长假的。国庆节是一年中的小长假,很多的朋友会选择旅行来度过。中国的旅游城市有很多,旅游景点也是数不胜数。

那么,2020国内十一国庆适合去哪里游玩呢?

项目目标

爬取美团旅游景点评论

受害者网址

代码语言:javascript
复制
[https://chs.meituan.com/](https://chs.meituan.com/)

代码

安装库

代码语言:javascript
复制
pip install requests
pip install time

导入工具

代码语言:javascript
复制
import requests
import time

解析网站,爬取数据

代码语言:javascript
复制
for page in range(10, 101, 10):
    time.sleep(1)
    url = 'https://www.meituan.com/ptapi/poi/getcomment?id=1161635&offset=0&pageSize={}&sortType=1'.format(page)
    headers = {
        'Host': 'www.meituan.com',
        'Pragma': 'no - cache',
        'Referer': 'https: // www.meituan.com / zhoubianyou / 1161635 /',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    html_data = response.json()
    info_data = html_data['comments']
    for i in info_data:
        info = i['comment']

保存数据

代码语言:javascript
复制
     for i in info_data:
        info = i['comment']
        with open('美团评论.csv', mode='a', encoding='utf-8-sig', newline='') as f:
            f.write(info)
            print(info)

运行代码,效果如下图

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-09-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 松鼠爱吃饼干 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 项目目标
  • 代码
  • 安装库
  • 导入工具
  • 解析网站,爬取数据
  • 保存数据
  • 运行代码,效果如下图
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档