首页
学习
活动
专区
工具
TVP
发布

大数据杂谈

关注大数据、机器学习,致力于分享Excel、R语言和Python等数据分析与数据挖掘技能。
专栏成员
26
文章
80648
阅读量
40
订阅数
12行Python暴力爬《黑豹》豆瓣短评
草长莺飞,转眼间又到了三月“爬虫月”。 这时往往不少童鞋写论文苦于数据获取艰难,辗转走上爬虫之路; 许多分析师做舆情监控或者竞品分析的时候,也常常使用到爬虫。
数据科学社区
2018-07-30
7730
Python 爬虫实践:《战狼2》豆瓣影评分析
本文作者:hang 本文来源:https://segmentfault.com/a/1190000010473819 简介 刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在
数据科学社区
2018-06-11
6980
Python 爬虫实战:股票数据定向爬虫
本文作者:hang 本文来源:https://segmentfault.com/a/1190000010520835 功能简介 目标: 获取上交所和深交所所有股票的名称和交易信息。 输出: 保存到文件中。 技术路线: requests—bs4–re 语言:python3.5 说明 网站选择原则: 股票信息静态存在于html页面中,非js代码生成,没有Robbts协议限制。 选取方法: 打开网页,查看源代码,搜索网页的股票价格数据是否存在于源代码中。 如打开新浪股票网址:链接描述(http://finance
数据科学社区
2018-06-11
1.4K0
从 Zero 到 Hero ,一文掌握 Python
本文来源:开源中国,译者rever4433, Tocy, Tony, 南宫冰郁 本文链接:https://www.oschina.net/translate/learning-python-from-
数据科学社区
2018-06-07
9440
用Python爬虫获取自己感兴趣的博客文章
来源: CDA数据分析师 在CSDN上有很多精彩的技术博客文章,我们可以把它爬取下来,保存在本地磁盘,可以很方便以后阅读和学习,现在我们就用python编写一段爬虫代码,来实现这个目的。 我们想要做
数据科学社区
2018-06-07
5460
如何用 Python 执行常见的 Excel 和 SQL 任务
作者:ROGER HUANG 本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/ 来源:https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库 中找到。有关如何使用 Github 的更多信息,请参阅本指南。 数据从业者有许多工具可用于分割数据。有些人使用 Excel,有些人使用SQL,有些人使用Python。对于某些任务,使用 Python 的优点是显而易见的。以更快的速度处理更大
数据科学社区
2018-04-19
10.8K0
Python难懂?买一次西瓜就懂了!
来源:代码湾 什么是code? code就就是一种语言,一种计算机能读懂的语言。计算机是一个傻*,他理解不了默认两可的任何东西。比如,你让你老公去买个西瓜,你老公会自己决定去哪里买,买几个,找个搞活
数据科学社区
2018-04-18
1.1K0
如何在jupyter中同时使用python2和3
如何在jupyter中同时使用python2和3? 由于我是通过anaconda来安装的Jupyter Notebook,所以首先需要解决Anaconda2(Python2)和Anaconda3(Python3)的共存。 只需要将Anaconda3的安装目录选在D:\Anaconda2\envs子目录下即可。详细安装教程请看这篇博文:http://blog.csdn.net/infin1te/article/details/50445217 安装完成之后,在CMD里面直接输入python会启动Python2
数据科学社区
2018-02-02
8.2K0
Conda:误解与迷思
翻译自:https://jakevdp.github.io/blog/2016/08/25/conda-myths-and-misconceptions/ 译者:taopanpantao 链接:http://blog.csdn.net/taopanpantao/article/details/53982752 我试着尽可能简洁,但如果你想要跳过这篇文章,并得到讨论的要点,你可以阅读每个标题以及下面的摘要。 神话#1:Conda是一个发行版,不是一个软件包管理器 现实:Conda是一个包管理器;Anacond
数据科学社区
2018-02-02
5.8K1
Python爬取自己微信好友信息,并制作好友签名词云
本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下: 《一件有趣的事: 爬了爬自己的微信朋友》 根据原作者的思路以及代码,爬取自己的微信好友信息并制作好友签名词云图,在本次实践中,主要使用itchat、jieba、wordcloud等包,原作者使用R进行图表可视化,我这里略做改进,使用了pyecharts包。 关于itchat包,中文文档: 1、https://itchat.readthedocs.io/zh/latest/ 2、http://www.cnblogs.com/yanjingnan
数据科学社区
2018-02-02
1.2K0
想学Python?做好第一步:环境配置
鉴于越来越多的人想要学习python,但是,有很多人在安装python第三方库的时候,陷入了无止境的痛苦之中,为什么呢?因为遇到了各种坑。 ——安装报错,报错了不知道怎么解决。 于是,开始郁闷、烦恼。 出现这种情况的其中一个重要原因,就是python的环境配置。 很多人以为不就安装个软件吗。如果你有这种想法,就大错特错,如果连第一步python的环境配置就做不好的话,将会对今后的使用带来极大的麻烦。 所以本文应运而生。 对于入门学习python,建议安装python+anaconda+pycharm。详细介
数据科学社区
2018-02-02
1.1K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档