数据分析第一炮

题图:from Instagram

10 月 8 号那天我发了一个朋友圈,内容是我总结的 Python 数据挖掘的相关内容,我还信誓旦旦地写了个闭关修炼。如今,两个月过去了。里面的每一个分支我还只干完了最基础的 Python 基础相关知识入门。自我欣慰的是,不管怎样,开始了就好,在路上起码比原地踏步让我舒心。

这张大图

那么问题来了,当我们谈论数据分析时,我们在谈论什么?

我们其实在谈论数据分析的三个部分。

1. 数据采集数据采集是我们的「原材料」,主要通过爬虫以及一些自动化工具采集得来。

2. 数据挖掘数据挖掘是数据分析中最有价值的部分,主要是要帮助我们找到数据的规律,帮助我们做出决策,完成业务诉求。

3. 数据可视化数据可视化可以帮助我们更直白地看到做出的结果,帮助我们理解或者向他人演示。

数据挖掘是数据分析的重中之重,每个人的差异和价值也体现在其中。

下面我列出数据挖掘的知识清单,供大家学习参考。

每一个算法都可能花你很多时间去搞懂,我希望大家可以先去了解下每个算法的基本含义以及作用,这样你才会有更深刻的印象。

留一个思考题,你要开始学习数据挖掘了,你有什么心得体会呢?如果一个淘宝店家要查看店铺商品之间的关联关系,他应该用那个算法呢?为什么?

自学很艰难,有一万个诱惑让你很难坚持。多少个日子,我不想总结近日所学内容,我不想写文章,写出来后几经易稿,最终文稿还是躺在我的草稿箱里。为啥?因为有些话我感觉我说出来不够分量,但那个底层逻辑是很多人不会去思考和重视的。

最后推荐大家一个学习方法:MAS 方法。

1. Multi-Dimension,从多维度看问题。

2. Ask,不懂就问,大胆一点。

3. Share,分享的过程也是一种总结。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181219G1GHXN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券