前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2021兰州疫情-新型冠状病毒疫情实时爬虫-3(实时更新)

2021兰州疫情-新型冠状病毒疫情实时爬虫-3(实时更新)

作者头像
Baige
发布2022-03-22 15:00:16
1K0
发布2022-03-22 15:00:16
举报
文章被收录于专栏:世荣的博客

前言 这里数据来源是很关键的一步,因为部分平台数据来源有一定异议,导致有误,这里我采用腾讯的数据来源。

1.确定数据源

数据源:腾讯疫情实时追踪

首先对该网站F12,点击Network刷新页面,看看每个页面的Response:

代码语言:javascript
复制
{\"confirm\":126286,\"heal\":117638,\"dead\":5696,\"nowConfirm\":2952,\"suspect\
     确诊              治愈             死亡            现存确证            疑似病例

Response URL:
https://view.inews.qq.com/g2/getOnsInfo?  
name=disease_h5&callback=jQuery35105860806421333924_1635943488534&_=1635943488535

但是再刷新一下会发现callback后面的东西就变了,推测这是一个时间戳,把它去了用这个:

代码语言:javascript
复制
https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5

这个就是我的数据源了,现在开始码代码:

2.写代码

这里需要引入的数据块:

代码语言:javascript
复制
import json
import requests
import pandas as pd
from pyecharts.charts import *
from pyechrats import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import ThemeType, chartType
from bs4 import Beautifulsoup

这里开始写抓取数据的代码:

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021 年 11 月,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.确定数据源
  • 2.写代码
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档