近半年,居士看了很多关于数据科学家的模模糊糊的概念,也听了很多所谓数据科学家讲到自己比数据分析怎么怎么厉害,但,细问其和数据分析、数据挖掘有何区别时,又含含糊糊,讲不清楚。
私以为,究其原因,很多所谓的数据科学家也并不知其岗位区别于其它岗位之本质为何,听到一两个厉害的名词就赶快套在自己身上,一旦被人深究,就原形毕露。
居士虽不明其本质,愿意分享自己在经过大量的调研和思考后,对该概念的理解,与各位小伙伴们探索进步。
废话少说,通过四个岗位的对比,简单阐述一下居士对于数据科学家的理解:
为了方便通过既能更深入地理解几个岗位,下面的表格简单列了一些能力项上的侧重点,供君参考(不同公司的情况可能有很大区别):
能力项目 | 数据工程师 | 数据分析师 | 算法工程师 | 数据科学家 |
---|---|---|---|---|
业务理解和沟通 | 一般 | 重要 | 中等 | 重要 |
数据解读和可视化 | 一般 | 重要 | 一般 | 重要 |
数据仓库和治理 | 重要 | 一般 | 中等 | 中等 |
统计学应用 | 一般 | 重要 | 中等 | 重要 |
机器学习应用 | 一般 | 中等 | 重要 | 重要 |
算法理论深度 | 一般 | 中等 | 重要 | 一般 |
大数据和软件工程能力 | 重要 | 一般 | 重要 | 一般 |
关于这个表格的详细解释这里暂且不多说,感兴趣的小伙伴可以自己翻阅资料了解。
前面的描述,相对是理想一点的情况,各个岗位有明确的分工。
数据科学家就成了一个既能帮助业务回答和解读业务现状的业务数据小能手,又能根据业务现在分析发现出业务增长策略的业务智囊大脑,同时又能通过AB实验等手段进行策略落地和实施的数据驱动业务专家。
但是,现状是,很多团队所谓的数据科学家,挂着的是数据科学家的title,但是做的可能和数据开发、数据分析没太大区别的事情:
当然,行业在发展,同时也在慢慢的成熟,居士今年了解到的情况已经比去年和前年好了太多了,至少很多大厂的数据科学小伙伴已经能做一些比较有意思的事情了。
以上,居士的个人理解,欢迎各位小伙伴指正不足之处,有交流才有进度。