《数据科学家访谈录》总结·2


01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman 06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen 11 - 15:Eithon Cadag, George Roumeliotis, Diane Wu, Jace Kohlmeier, Joe Blitzstein


  1. Clare Corthell “开源数据科学高手”课程创建者 教育经历:斯坦福大学·学士 职业经历:Mattermark数据主管
  • 与众不同之处

在斯坦福的专业是科学技术与社会学,完全是靠自学掌握了数据科学。是一个主动学习能力非常强,很有恒心的人。

  • “开源数据科学高手”地址(注:好资料!)

http://datasciencemasters.org/ https://github.com/datasciencemasters

  • 推荐《集体智慧编程》一书

“每一次我打开它的时候,总有一些新的知识会跳出来,并且我也越来越理解有关整合用户想法的东西。那本书成了我的基石,我用它来衡量我取得的进步。它绝对是数据科学家的“圣经”。”

  1. Drew Conway 《Machine Learning for Hackers》共同作者 数据科学韦恩图创建者 教育经历:计算机科学与政治科学双学位,纽约大学政治学博士 职业经历:IA Ventures,Project Florida数据主管
  • 数据科学韦恩图
  • 为什么要读博士?

遇到了职业天花板。在纽约读博期间创建了data kind,并与Mike Dewar和Hilary Mason结识。

  • 讲故事的能力

“其实大部分数据科学家所做工作中的一大部分都不是数据整理或者建模或者编程,而是一旦你做出了一个结果,你必须要想办法将结果解读给那些完全不具备看懂这个图所必需的技能的人听,例如那些做商业决定或者工程决策的重要人物。”

  • 比较纽约和硅谷

纽约资源配置更加集中。

  • 选择Python还是R?

“他们想要学习Python或者R但是不确定哪一个更好,我告诉他们不要犹豫,直接选一个深深地扎下去就行。”(注:我觉得还是Python生态好)

  1. Kevin Novak 教育经历:密歇根州立大学核物理博士,研究方向回旋加速器,主要工作是用统计方法去对核交互作用中的理论模型建模,然后用加速器里跑出来的数据来验证模型是否正确。 职业经历:Uber数据科学主管
  • Uber数据团队构成

Uber数据团队中的每个人几乎都是来自非传统的行业背景的。他们过往差不多都在做各自不同的东西。

  • 数据科学包括什么?

其中一个概念就是“大数据”,海量的数据经过处理分析被提取出数学化的结论。另一个概念就是高度专业化的预测建模。

  • 数据科学必备技能

数学、统计学、计算机科学。

  • 数据科学的前景

传统的数据领头羊公司专注还是社交数据,Uber用于解决物流问题的方法也可以推广到一切统筹问题。其它的还包括,分析基因组、健康领域。

  1. Chris Moody 教育背景:加州理工学士,本科物理学;加州大学圣克鲁斯分校博士,研究方向计算天文学(注:Chris从本科开始就与天文学打交道)。 职业经历:Square,Stitch Fix。
  • 自学

“我的一大部分软件工程技术,甚至于整个计算机科学知识,都是完全自学的。我没有上过任何那个领域的正式课程。”

  • 数据科学意味着什么?

“总体上来说,它意味着你对数据进行计算的方式,能够有能力对数据进行解读,对数据进行建模,并且最重要的就是,有能力用数据的内在意义去与别人沟通交流。”

数据科学大概可以分为两个板块:描述分析和预测分析。预测分析型数据科学家需要一些有关于机器学习的知识,而描述型的数据科学家应该需要一些统计学知识。

  • 相比于优秀的数据科学家,卓越的数据科学家具有怎样的素养?

“我觉得可能是沟通交流方面的技巧。你必须要有能力去将你做的东西讲出来给别人听。”

“编程能力不会是最重要的能力。”

  1. Erich Owen 教育经历:Albion文科学校学士·数学物理(注:原书这里翻译成立自由艺术学校,囧),布朗大学硕士·应用数学 职业经历:Quid、Newsle、Facebook
  • 大学时代最应该做的事

去做实实在在的东西,建立网站或者完成一些项目,写更多的程序。

  • 在Facebook的工作

主要工作是搭建全栈系统,也做机器学习。

  • 相较于一般的数据科学家,是什么品质让那些卓越的数据科学家得以脱颖而出?

扎实的编程基本功和系统的思维能力是最为重要的。

  • 数学的作用

举例,低通路的过滤器去过滤这一批数据,“数模转换”概念对于研究社交数据的作用;奇异值分解;随机映射。

  • 关于学习

“我觉得根据我多年的本科和研究生经历,我做的最为有用的事情就是我一直在不断地在学习,并且我是为了求知而学习,因为我真的对于学习很有兴趣。”

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【数据科学】数学的意义(院士最全最牛的解释,果断收藏)

作者:张恭庆 (北京大学数学科学学院教授、中国科学院院士、第三世界科学院院士) 数学既是一种文化、一种“思想的体操”,更是现代理性文化的核心。 马克思说:“一...

52280
来自专栏新智元

认知科学与人机交互简史

前言 “水是最好的”(Water is best),这句话是西方“科学和哲学之祖”泰勒斯(Thales,约公元前624年——公元前546年)的名言,无独有偶,与...

38950
来自专栏钱塘大数据

美如画丨2018年度最佳数据可视化作品

过去几年,对数据以及数据分析的关注可谓达到了一个新的高度。如今,数据和信息已经成为一种可以带来绝妙视觉观感的工具。曾经简单的图表和散点图,现在已经成了数据艺术中...

19840
来自专栏钱塘大数据

高文院士:从大数据时代来到人工智能时代,我们走了多远了?

11月6日,京东举行 JDD京东金融全球数据探索者大会,在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践 。中国工程程院院士、北京大学...

16320
来自专栏腾讯研究院的专栏

互联网中的大脑

image.png 推荐语: 这是一篇容易被忽视的科技报道,但它很可能隐含着21世纪最重要的科学启示:互联网与脑科学的关系问题。 大工业革命使人...

19670
来自专栏机器人网

做工业设计必学的软件有哪些?

工业设计专业学生或从事工业设计的人应该熟练掌握哪些软件?这个问题相信给不少该领域的人带来困惑,本文作者从工业设计的流程出发,引出实际工作中会使用到的软件,以及不...

34030
来自专栏量子位

大咖来信 | 张亚勤@2018:终日“闭关”读论文,思考终极算法

10320
来自专栏邱翔的终身学习

iPhone X的Face ID有多安全?

344100
来自专栏华章科技

为什么要学数学?因为这是一场战略性的投资

导读:本文是李大潜院士在复旦大学数学科学学院新生迎新大会上的讲话,随后演讲稿在朋友圈爆红。没错,一篇关于数学的演讲稿竟然就这么火了,你或许会一脸懵B。那么就看看...

8910
来自专栏CDA数据分析师

盘点 | 2018年度最佳数据可视化作品都在这了!

过去几年,对数据以及数据分析的关注可谓达到了一个新的高度。如今,数据和信息已经成为一种可以带来绝妙视觉观感的工具。曾经简单的图表和散点图,现在已经成了数据艺术中...

15510

扫码关注云+社区

领取腾讯云代金券