腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

古时的风筝

专栏作者

123

文章

165730

阅读量

50

订阅数

web scraper 抓取数据并做简单数据分析

爬虫网站 jquery 数据分析 https

其实 web scraper 说到底就是那点儿东西，所有的网站都是大同小异，但是都还不同。这也是好多同学总是遇到问题的原因。因为没有统一的模板可用，需要理解了 web scraper 的原理并且对目标网站加以分析才可以。今天再介绍一篇关于 web scraper 抓取数据的文章，除了 web scraper 的使用方式外，还包括一些简单的数据处理和分析。都是基础的不能再基础了。选择这个网站一来是因为作为一个开发者在上面买了不少课，还有个原因就是它的专栏也比较有特点，需要先滚动加载，然后再点击按钮加载。

古时的风筝

2019-09-29

1.5K0

web scraper 抓取网页数据的几个常见问题

爬虫网站 xslt & xpath 文件存储

相关文章：最简单的数据抓取教程，人人都用得上 web scraper 进阶教程，人人都用得上

古时的风筝

2019-05-25

2.9K0

web scraper 抓取分页数据和二级页面内容

爬虫网站 https 网络安全

如果你已经用过这个工具，想必已经用它抓取过一些数据了，是不是很好用呢。也有一些同学在看完文章后，发现有一些需求是文章中没有说到的，比如分页抓取、二级页面的抓取、以及有些页面元素选择总是不能按照预期的进行等等问题。

古时的风筝

2018-07-31

4.8K1

webscraper 最简单的数据抓取教程，人人都用得上

这么简单的工具当然对环境的要求也很简单了，只需要一台能联网的电脑，一个版本不是很低的 Chrome 浏览器，具体的版本要求是大于 31 ，当然是越新越好了。目前 Chrome 的已经是60多了，也就是说这个版本要求也不是很高。

古时的风筝

2018-07-31

2.5K0

最简单的数据抓取教程，人人都用得上

这么简单的工具当然对环境的要求也很简单了，只需要一台能联网的电脑，一个版本不是很低的 Chrome 浏览器，具体的版本要求是大于 31 ，当然是越新越好了。目前 Chrome 的已经是60多了，也就是说这个版本要求也不是很高。

古时的风筝

2018-04-02

1.8K0

Scrapy爬取自己的博客内容

根据给定的文章内容，撰写摘要总结。

古时的风筝

2018-01-08

7680

用python实现的百度音乐下载器-python-pyqt-改进版

摘要总结：本文介绍了一个用Python实现的百度音乐下载器，包括其爬虫程序、解析歌曲信息、下载歌曲以及UI界面实现等。该下载器支持快速扫描并下载热门歌曲，同时也可以登录百度账号进行歌曲的下载。通过使用多线程、BeautifulSoup和HtmlParser等技术，实现了快速下载歌曲的功能。

古时的风筝

2018-01-08

1K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态