这个全民搞数据的年代越来越多新毕业的博士问我说,怎么样才能成为一个挣钱比较多的数据科学家?这个问题很广泛,因为要会的太多了而技术都在不断进步并且我也不能保证挣钱比较多,技术上大家可以参看山寨知乎网上的总结贴以及我的领英交友网(Linkedin)上面一哥们写的数据科学家地铁导航。作为这两个总结贴的补充,单独谈谈“数据科学”和“机器学习”这两个几乎总是同时出现的词:到底数据科学需要多少机器学习。
老实来说,搞数据的一般称自己的工作为“应用机器学习”,也就是说拿机器学习来解决实际问题。事实上平均下来,我们日常工作中只有10%时间在和机器学习模型相关,这不骗你。之所以说,数据科学要会很多乱七八糟的东西,主要都是在那另外90%上,包括净化数据,结构化数据,学习讨论特定领域知识之类的,这些才是最费时间的。
在这10%时间的机器学习里面,一个合格的数据科学家得会到什么程度呢?我以问答的方式来简单说一下:
你看,本文为了响应净化中文网络环境尽量不说英语的号召,这写的多别扭啊。
文章来源:http://www.ppvke.com/Blog/archives/17954