如果你找一个熟悉的朋友给你推荐书单,他会倾向于越短越好,因为他想把他知道的最好的推荐给你,让你少花时间在不重要的事情上。
但如果你在网上看到一个书单,往往会发现都很长长长长长,长到你觉得别人都能日读40万字而自己是个天天刷朋友圈的懒癌患者。别担心,告诉你个小秘密,列书单的人很可能自己也没读完书单里的书哦。
所以我想做的是像你的朋友一样,推荐一份数据分析入门的极简书单给你,并且帮你深度评测,告诉你什么是最值得读的、不得不读的。
你不是吃个火锅都要看评测吗?吃火锅也就花个两小时吧,但是读一本书,很可能要花上一个月时间呀,这么大的时间成本,总应该更慎重的做出决定吧。
以下评测会从数据分析岗位必备的三个技能出发:
一提到 SQL 入门,呼声最高的是这3本书:
《MySQL必知必会》- Ben Forta[1]
《SQL必知必会》- Ben Forta[2]
《SQL基础教程》- Mick[3]
首先要搞清楚的一件事,《MySQL必知必会》和《SQL必知必会》是同一个作者 Ben Forta ,《SQL必知必会》的前20章所有内容在《MySQL必知必会》里都有,并且多了10章针对 MySQL 的内容。
这是作者在前言中的解释:
考虑到在中国 MySQL 还是占主流,评测时选择了后出版的、内容更丰富的《MySQL必知必会》。
(出版社喜欢把这两本捆绑在一起卖,真的没必要都买,80%内容都雷同的)
先放上两张我悉心整理的全书思维导图,一眼就可以看出《MySQL必知必会》和《SQL基础教程》的不同:
《MySQL必知必会》思维导图[4]
《SQL基础教程》思维导图[5]
《MySQL必知必会》这本书讲解的非常的全面。
光是最常用的 SELECT语句就花了12章来细细讲解。并且整本读下来会感觉到逻辑是非常清晰的,时刻知道自己学的是知识体系上的哪一个分支。
而《SQL基础教程》的讲述结构并不是按照知识的逻辑,而是按照使用的逻辑。
所以你会看到在思维导图上会出现同一章的不同节被拆开放到了不同分支的情况,第三章第一节还在讲聚合函数,到了第二节就去讲 SELECT 语句的 GROUP BY 子句了,因为在作者看来这两节都是用来解决「聚合与排序」这个使用场景的问题,所以就被归纳到了一起。
和《MySQL必知必会》相比其实是少了很多知识点的,《MySQL必知必会》用了4章去讲解的 WHERE 子句,在《SQL基础教程》中就只有1小节带过。
这里对比一下最基本的 SELECT 语句这个知识点的讲述方式:
《MySQL必知必会》的讲述方式几乎没什么废话,直接上案例,需要输入什么代码,会输出什么结果,都用很清晰的方式呈现出来。对于一些细枝末节的细节提示和说明,都采用灰框的方式附在案例后面逐一列出。
《SQL基础教程》使用了双色印刷,配了表格图片去帮助读者理解。在案例代码之前,还会多给一个基本语法的示例,讲解同一个知识点的篇幅会更长,甚至会有点啰嗦。
对比来看,《MySQL必知必会》的简明的讲述方式更适合喜欢简单直接的理工直男,《SQL基础教程》更适合喜欢详尽说明的文科生。
《MySQL必知必会》在每章的开始会有一个一句话简介,每章的末尾会有一小段的小结,和整体的行文风格一样,都是非常简明扼要的,也方便查阅。
《SQL基础教程》在每章和每节开始之前会有一个详尽的说明和学习重点清单,在每章结束时会有几道练习题。
如果你需要在工作中用到 SQL,还是更推荐《MySQL必知必会》,这本书的知识点覆盖是更全面的,简明扼要的风格也方便随时查阅。
如果你缺乏理工科背景、抽象思维比较弱、注意力已经被碎片化阅读摧毁,可以先阅读《SQL基础教程》,更便于你理解。能上手了之后,再去读《MySQL必知必会》补全知识体系。
作为统计学的入门,我们以这两本书来进行深入对比。
《深入浅出统计学》- Dawn Griffiths[6]
《商务与经济统计学》-詹姆斯·麦克拉夫[7]
统计学的教材可以说是非常多了,并且相似度很高,在这里选取人大出版的这本经典之作《商务与经济统计学》。
有些 900 多页的教材属于进阶学习,不算是入门书了。
另外一些社科鸡汤类的书也没有放进来,在我看来,人是无法以绕开知识本身的方式学到知识的。
还是先放两张全书思维导图
《深入浅出统计学》思维导图[8]
《商务与经济统计学》思维导图[9]
《深入浅出统计学》涵盖了基本的统计学概念,默认读者是零基础。
甚至连平均数、中位数这种小学六年级教材中的基础知识都会细细讲解。一般来说,一本书越是照顾零基础,书的知识点深度就会越低,这本也不例外。包括比较重点的描述统计、假设验证都停留在简单例子的步骤上。
当然,这种方式的好处是激发读者兴趣,如果一本书是用漫画或者小说去讲解统计学,那知识点深度就更低了。
《商务与经济统计学》的结构就是按照知识的逻辑来进行讲述的。
知识难度会循序渐进的去递进,先让你理解最简单的情景,再逐渐去增加情景的复杂度,比如从单样本到多样本,从简单线性回归到多元线性回归。并且所有案例都是基于真实的数据去展开的,这也让知识点的覆盖更加全面。
这里用统计学里一个经典的知识点「正态分布」来对比两本书讲述方式的不同:
《深入浅出统计学》用生活中的小事作为案例,一个女生找高个男朋友的例子去引出正态分布的概念,用了很多的插图去辅助读者理解,并且每个概念后面会有一个「世上没有傻问题」的栏目去整理出所有的常见问题和回答,解答初学者心中的疑问。
我还没见过看不懂《深入浅出》的人呢,这个难度高一学生也能看懂的。有些地方甚至会感觉太简单而读不下去。
《商务与经济统计学》不像一般的教材会写大段的概念和定义,而是用了大量的例子帮助读者真正理解,讲正态分布这一个概念就用了 9 个例子。并且这些例子都是用的真实的数据和贴近实际工作的场景。