腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据
多年海量数据处理经验,化数据为力量
专栏作者
举报
174
文章
274462
阅读量
108
订阅数
订阅专栏
申请加入专栏
全部文章(174)
大数据(94)
spark(19)
hadoop(19)
爬虫(15)
python(13)
数据库(12)
人工智能(12)
数据处理(12)
其他(9)
apache(8)
机器学习(7)
sql(7)
数据挖掘(5)
scrapy(5)
安全(5)
深度学习(4)
编程算法(4)
存储(4)
区块链(3)
神经网络(3)
数据分析(3)
数据可视化(3)
系统架构(3)
hbase(3)
NLP 服务(2)
ios(2)
java(2)
r 语言(2)
云数据库 SQL Server(2)
oracle(2)
github(2)
api(2)
linux(2)
spring(2)
mapreduce(2)
分布式(2)
安全漏洞(2)
数据结构(2)
虚拟化(2)
比特币(1)
数字货币(1)
tensorflow(1)
javascript(1)
go(1)
.net(1)
scala(1)
vue.js(1)
node.js(1)
xml(1)
html(1)
android(1)
nosql(1)
搜索引擎(1)
中文分词(1)
ubuntu(1)
腾讯云测试服务(1)
企业(1)
渲染(1)
svg(1)
yarn(1)
云+未来(1)
开源(1)
自动化(1)
运维(1)
黑客(1)
网络安全(1)
hive(1)
dns(1)
pytorch(1)
cdn(1)
kernel(1)
uml(1)
anaconda(1)
微信(1)
物联网(1)
https(1)
fpga(1)
企业组织(1)
云计算(1)
kafka(1)
max(1)
mean(1)
min(1)
pm2(1)
搜索文章
搜索
搜索
关闭
scrapy如何顺序执行多个爬虫
爬虫
大数据
scrapy
scrapy如何单线程顺序执行多个爬虫,刚开始我天真的以为将多个excute顺序罗列就能依次执行每个爬虫了,代码如下所示: 📷 谁料,在执行完第一个爬虫之后,整个程序就停止运行了。到底是什么原因呢?笔者在 Stack Overflow 上找到了类似的问题( https://stackoverflow.com/questions/24875280/scrapy-cmdline-execute-stops-script )。得知问题的原因在于 方法中的最后一句代码是 ,所以当程序执行完一个execute语
企鹅号小编
2018-01-29
2K
0
Scrapy递归抓取简书用户信息
scrapy
python
爬虫
好久没有录制实战教程视频,大邓就在圣诞节后直接上干货。 之前写过一期【视频教程-用python批量抓取简书用户信息】的文章,是自己造的轮子,今天我趁着刚入门scrapy和xpath,操刀重写这个任务。 一、实战项目简介递归 我们要大批量获取简书网站上的用户数据,最直接的办法是给一个初识的用户url,从这个用户的关注的和粉丝中再抽取url,循环往复,周而复始。这其实就是递归。 数据项 获取到的url,我们需要对其进行请求,解析出想要的数据 📷 昵称-nickname 关注数-followed 粉丝数- fol
企鹅号小编
2018-01-26
1.3K
0
Python爬虫之urllib库—爬虫的第一步
爬虫
scrapy
linux
第一个爬虫代码的实现我想应该是从urllib开始吧,博主开始学习的时候就是使用urllib库敲了几行代码就实现了简单的爬数据功能,我想大多伙伴们也都是这么过来的。当时的感觉就是:哇,好厉害,短短几行竟然就可以搞定一个看似很复杂的任务,于是就在想这短短的几行代码到底是怎么实现的呢,如何进行更高级复杂的爬取呢?带着这个问题我也就开始了urllib库的学习。 首先不得不提一下爬取数据的过程,弄清楚这到底是怎样一个过程,学习urllib的时候会更方便理解。 爬虫的过程 其实,爬虫的过程和浏览器浏览网页的过程是一样的
企鹅号小编
2018-01-11
642
0
python 斗鱼爬虫
爬虫
scrapy
python
本文介绍了一种基于Python的斗鱼直播信息抓取方法,使用requests和BeautifulSoup库获取指定游戏分类的直播间列表,并利用Selenium库进行翻页操作。最后,将获取到的直播间信息保存到文本文件中。需要注意的是,在爬取过程中要遵循网站的robots协议,尽量不频繁访问,避免给服务器带来压力。
企鹅号小编
2018-01-04
1.8K
0
我是这样开始写Python爬虫的
爬虫
scrapy
python
企鹅号小编
2017-12-28
2.4K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档