大数据杂谈

关注大数据、机器学习,致力于分享Excel、R语言和Python等数据分析与数据挖掘技能。

27 篇文章
36 人订阅

全部文章

大数据杂谈

12行Python暴力爬《黑豹》豆瓣短评

草长莺飞,转眼间又到了三月“爬虫月”。 这时往往不少童鞋写论文苦于数据获取艰难,辗转走上爬虫之路; 许多分析师做舆情监控或者竞品分析的时候,也常常使用到爬虫。

1406
大数据杂谈

被称为“开发者神器”的GitHub,到底该怎么用?

导读:GitHub是一个拥有数十亿行代码的网站,每天有数百万开发者聚集在一起,研究开源软件中存在的问题。开发人员每天都要在工作中使用GitHub或其他基于Git...

663
大数据杂谈

Python中用K-均值聚类来探索顾客细分

在这篇文章中,我要谈的东西是相对简单,但却是对任何业务都很重要的:客户细分。客户细分的核心是能够识别不同类型的客户,然后知道如何找到更多这样的人,这样你就可以…...

953
大数据杂谈

Python爬虫:爬取拉勾网职位并分析

本文从拉勾网爬取深圳市数据分析的职位信息,并以CSV格式保存至电脑,之后进行数据清洗,生成词云,进行描述统计和回归分析,最终得出结论。

892
大数据杂谈

大数据实战:知乎百万用户分析

这几天,同事都去出差,稍有感冒的我提前在办公室感受到了“孤独终老”的恐惧。 于是,我想在自己有能力并且还有激情的时候,去做一些以后值得回忆的事。我萌生了去“探...

1443
大数据杂谈

非常实用的九个程序员工具网站

1284
大数据杂谈

Google Colab 免费GPU服务器使用教程

2598
大数据杂谈

Python 爬虫实践:《战狼2》豆瓣影评分析

2005
大数据杂谈

Python 爬虫实战:股票数据定向爬虫

2254
大数据杂谈

【Excel】用公式提取Excel单元格中的汉字

1525
大数据杂谈

从 Zero 到 Hero ,一文掌握 Python

1649
大数据杂谈

用Python爬虫获取自己感兴趣的博客文章

1639
大数据杂谈

如何用 Python 执行常见的 Excel 和 SQL 任务

作者:ROGER HUANG 本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/ 来源:https:...

4486
大数据杂谈

Python难懂?买一次西瓜就懂了!

来源:代码湾 什么是code? code就就是一种语言,一种计算机能读懂的语言。计算机是一个傻*,他理解不了默认两可的任何东西。比如,你让你老公去买个西瓜,你...

3558
大数据杂谈

如何在jupyter中同时使用python2和3

如何在jupyter中同时使用python2和3? 由于我是通过anaconda来安装的Jupyter Notebook,所以首先需要解决Anaconda2(P...

1759
大数据杂谈

Conda:误解与迷思

翻译自:https://jakevdp.github.io/blog/2016/08/25/conda-myths-and-misconceptions/ 译者...

32210
大数据杂谈

Python爬取自己微信好友信息,并制作好友签名词云

本文参考教程来自微信公众号【Alfred在纽西兰】,文章如下: 《一件有趣的事: 爬了爬自己的微信朋友》 根据原作者的思路以及代码,爬取自己的微信好友信息并制...

2375
大数据杂谈

【Excel系列】Excel数据分析:假设检验

Excel数据分析工具库中假设检验含5个知识点: Z-检验:双样本均值差检验 T-检验:平均值的成对二样本检验 T-检验:双样本等方差假设 T-检验:双样本异方...

31110
大数据杂谈

【Excel系列】Excel数据分析:方差分析

单因素方差分析 12.1 单因素方差分析基本理论 (1)单因素方差分析的概念 单因素方差分析,是指对单因素试验结果进行分析,检验因素对试验结果有无显著性影响的...

2225
大数据杂谈

【Excel系列】Excel数据分析:相关与回归分析

相关系数 15.1 相关系数的概念 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient)。相关系数是用以反映变量...

2848

扫码关注云+社区