腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Zchannel
专栏成员
举报
75
文章
88317
阅读量
13
订阅数
订阅专栏
申请加入专栏
全部文章(75)
其他(18)
游戏(17)
linux(7)
windows(7)
安全(5)
github(4)
python(3)
android(3)
存储(3)
开源(3)
https(3)
iphone(2)
unix(2)
ubuntu(2)
人工智能(2)
网站(2)
http(2)
shell(2)
facebook(2)
tensorflow(1)
ios(1)
mac os(1)
.net(1)
硬件开发(1)
云数据库 Redis(1)
sql(1)
access(1)
git(1)
apache(1)
nginx(1)
深度学习(1)
域名注册(1)
mongodb(1)
图像处理(1)
渲染(1)
编程算法(1)
缓存(1)
黑客(1)
爬虫(1)
网络安全(1)
ssh(1)
yum(1)
ftp(1)
ddos(1)
微信(1)
安全漏洞(1)
es(1)
app(1)
gpu(1)
mesh(1)
steam(1)
wifi(1)
编译(1)
互联网(1)
开发者(1)
跨平台(1)
路由器(1)
性能(1)
搜索文章
搜索
搜索
关闭
使用python爬虫分析《我不是药神》豆瓣一千条短评
python
爬虫
https
github
mongodb
小爬怡情,中爬伤身,强爬灰灰。爬虫有风险,使用请谨慎,可能是这两天爬豆瓣电影爬多了,今天早上登录的时候提示号被封了(我用自己帐号爬的,是找死呢还是在找死呢 ...),好在后面发完短信后又解封了,^_^。 之前的文章中,已把电影短评数据装进了Mongo中,今天把数据取出来简单分析一下,当下最火的做法是进行词频统计并生成词云,今天说的就是这个。 读取Mongo中的短评数据,进行中文分词 不知道什么原因,我实际爬下来的短评数据只有1000条(不多不少,刚刚好),我总觉得有什么不对,但我重复爬了几次后,确实只有这
Zip
2018-07-20
808
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档