“无论在学术界还是工业界,数据科学尚在定义中。”
“面对数据有无数可能,但是只有一部分合乎道德(并且有趣)的问题需要我们花力气去解决。”
数据科学需要的技能清单(多的有点吓人):
探索性数据分析
可视化(用在探索性数据分析和汇报中)
数字面板和矩阵
对业务的洞察力
数据驱动决策
数据工程和处理大数据的能力(Mapreduce、Hadoop、Hive、Pig)
收集数据
构建数据管道(日志-->mapreduce-->数据文件-->同其他数据合并-->mapreduce-->清除一些噪声-->合并)
开发新产品,而不仅仅停留在对现有产品的使用进行描述上
写专利
数据侦探
预测未来的行为或性能
将发现写成报告,做讲演或发表在学术期刊上
编程(R、Python、C和Java等)
条件概率
优化
算法,统计模型和机器学习
讲故事的能力
会提问题
做调查
搞研究
从数据中做出推测
开发数据产品
找到处理数据的方法,会根据数据规模改变分析策略
一致性检查
对数据的直觉
和领域专家打交道的能力
设计和分析实验
发现数据间的相关性,并尝试建立潜在的因果关系
领取专属 10元无门槛券
私享最新 技术干货