首页
学习
活动
专区
工具
TVP
发布

大数据杂谈

关注大数据、机器学习,致力于分享Excel、R语言和Python等数据分析与数据挖掘技能。
专栏作者
26
文章
75110
阅读量
40
订阅数
12行Python暴力爬《黑豹》豆瓣短评
草长莺飞,转眼间又到了三月“爬虫月”。 这时往往不少童鞋写论文苦于数据获取艰难,辗转走上爬虫之路; 许多分析师做舆情监控或者竞品分析的时候,也常常使用到爬虫。
数据科学社区
2018-07-30
7480
Python 爬虫实践:《战狼2》豆瓣影评分析
本文作者:hang 本文来源:https://segmentfault.com/a/1190000010473819 简介 刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在
数据科学社区
2018-06-11
6870
Python 爬虫实战:股票数据定向爬虫
本文作者:hang 本文来源:https://segmentfault.com/a/1190000010520835 功能简介 目标: 获取上交所和深交所所有股票的名称和交易信息。 输出: 保存到文件中。 技术路线: requests—bs4–re 语言:python3.5 说明 网站选择原则: 股票信息静态存在于html页面中,非js代码生成,没有Robbts协议限制。 选取方法: 打开网页,查看源代码,搜索网页的股票价格数据是否存在于源代码中。 如打开新浪股票网址:链接描述(http://finance
数据科学社区
2018-06-11
1.4K0
用Python爬虫获取自己感兴趣的博客文章
来源: CDA数据分析师 在CSDN上有很多精彩的技术博客文章,我们可以把它爬取下来,保存在本地磁盘,可以很方便以后阅读和学习,现在我们就用python编写一段爬虫代码,来实现这个目的。 我们想要做
数据科学社区
2018-06-07
5240
Python爬取自己微信好友信息,并制作好友签名词云
本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下: 《一件有趣的事: 爬了爬自己的微信朋友》 根据原作者的思路以及代码,爬取自己的微信好友信息并制作好友签名词云图,在本次实践中,主要使用itchat、jieba、wordcloud等包,原作者使用R进行图表可视化,我这里略做改进,使用了pyecharts包。 关于itchat包,中文文档: 1、https://itchat.readthedocs.io/zh/latest/ 2、http://www.cnblogs.com/yanjingnan
数据科学社区
2018-02-02
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档