专栏首页PPV课数据科学社区Kaggle 2017数据科学报告:最受欢迎的工具竟然是......

Kaggle 2017数据科学报告:最受欢迎的工具竟然是......

摘要:数据平台 Kaggle 近日发布了2017 机器学习及数据科学调查报告,针对最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等进行深度调查。此次调查共收到16000余份回复。

正文:

2017年,我们首次进行了全行业调查,以全面了解数据科学和机器学习的生态。我们收到了超过16,000份回复,我们调查了”谁在处理数据?”,"各行业机器学习的最前沿发生了什么?”,”新进入这一领域的数据科学家如何取得突破?”等问题并获得了大量反馈信息。本文分享了我们的一些重要发现,其中的摘要内容如下:

  • 尽管Python可能是整体上最常用的工具,但更多的统计人员报告使用R;
  • 数据科学家平均年龄在30岁左右,但这个数值在不同国家有所不同;
  • 获得硕士学位的比例最高,但薪水最高($ 15K +)的学生更有可能拥有博士学位;

Ⅰ、谁在使用数据?

我们将从年龄、就业状况、薪资待遇几个方面对这个群体做一个基本了解:

⒈你的年龄?

从全球范围来看,本次调查对象的平均年龄在30岁左右。在不同的国家,数值会有所差异,加拿大接受问卷调查的平均年龄为34岁,而中国的机器学习从业者年龄的中位数是25岁。

⒉ 就业状况如何?

全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达70.9%。

⒊你工作中的头衔是什么?

数据科学领域可涵盖的工作非常多,包括机器学习工程师、数据分析师、数据科学家、软件开发人员、数据挖掘人员等。其中,数据科学家人数占比最高,达24.4%。软件开发人员/工程师位居第二,但人数仅占12.3%,数据分析师紧跟其后,以11.3%位列第三。

⒋你的全职年薪是多少?

数据科学人员的年薪中位数为$55,441。在中国,数据科学家的年薪中位数为$29,835,美国则高达$110,000。

⒌你的最高学历是什么?

在数据科学领域工作的人中学历比例最高的是硕士,但平均薪酬最高的人是博士(150K - 20万美元和20万美元)。

就中国而言,硕士学位在总体占比为40.5%,博士仅11.2%,本科学位从业人数则高达39.5%,与硕士从业人数持平。

而美国,硕士学位只有44.5%,博士学位高达20.7%,本科从业者占比也高达26.5%。

Ⅱ、数据科学家在工作中做什么?

数据科学家被定义为“通过编写代码来分析数据”。他们日常的工作是什么的,下面是我们发现的一些亮点:

⒈在工作中使用哪些数据科学方法?

逻辑回归是所有行业最常用的数据科学方法,除了军事和安全领域(注:这些领域神经网络使用更多一些)。决策树、随机森林、神经网络、贝叶斯分别排名第2到第5位。

⒉工作中最常用的工具?

Python是数据科学家最常用的数据分析工具,R紧随其后,事实上,更多的统计分析人员更偏爱R。

⒊工作中使用什么类型的数据?

关系型数据是最常用的数据类型,学术研究者和国防安全领域则更青睐文本和图像。

⒋工作中主要遇到的问题是什么?

调查结果显示,脏数据是数据科学领域工作人员最常遇到的问题。此外,缺乏数据科学技能、缺乏有效管理和资金支持也是困扰他们的常见问题。

你可能注意到了,目前许多行业的受访者表示他们在组织中非常缺乏数据科学人才,这对于想要进入这一领域的小伙伴无疑是个好消息,那么如何才能进入这一领域呢,请继续看我们的调查报告。

Ⅲ、新的数据科学家如何进入该领域?

当你开始一条新的职业道路时,了解其他人如何成功是很有帮助的。我们调查了数据科学行业从业者他们是如何做到的,以下是来自他们的一些建议:

⒈你会推荐新的数据科学家首先学什么语言?

使用Python或R的人都觉得他们的选择没错,但是如果你让他们推荐的话,推荐Python的可能性是R的两倍。

⒉你使用哪些数据科学学习资源?

数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。Kaggle、Stack Overflow Q&A、Conferences 和 Podcasts 是已从业者经常使用的学习平台。

⒊哪里找到你需要的数据?

没有数据就没有数据科学。当谈到学习数据科学技能时,知道如何找到用于实践的数据集是非常有价值的。调查显示,数据聚合平台是人们最常用获取数据的途径,其次是谷歌搜索引擎。

⒋你如何寻找或找到工作?

在数据科学领域,联系直接联系企业招聘人员或建立你的社交人脉是进入这一领域的最佳途径。

END.

PPV课小组翻译

本文分享自微信公众号 - PPV课数据科学社区(ppvke123),作者:Kaggle

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 通过4部美剧教你看懂大数据

    美剧你爱追么?这些美剧你看过么?这些美剧和大数据有联系你知道么? 什么?你不知道?学统计的怎么能不知道?难道一直做题目不枯燥么?有空看看这些吧,在娱乐中学习,...

    小莹莹
  • 白话大数据 | 配图才是亮点啊~

    这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头。但是,到底什么才是大数据?是H...

    小莹莹
  • 2014-2015大数据行业年终盘点和预测

    2014-2015大数据行业年终盘点和预测 大数据时代不是突然出现的,实际上过去的几十年间,数学分析就已经涉猎金融行业了,诺贝尔经济学奖获得者哈里.马克维茨、威...

    小莹莹
  • 哥伦比亚大学数据科学课程笔记

    大数据文摘
  • 亚马逊阿里 搭建数据化运营系统秘籍

    随着互联网时代的发展,企业发现过去他们所做的粗狂式运营已经不能有效的提升效率和增加企业用户了,所以,一些企业开始找寻新的运营方式,比如逐渐转变为CPM(每千人...

    灯塔大数据
  • 利用大数据精准营销,给消费者一个选You的理由!

    【数据猿导读】大数据是社会科学重要的进展,但企业要精准抓住未来,经理人要拥有更好的决断力,还是要基于对不同人、不同性的理解,而不仅是科技工具的使用而已。

    数据猿
  • 【BDTC 2015】大数据分析及生态系统分论坛:HBase、Spark、ES、Kylin技术生态

    2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办,...

    CSDN技术头条
  • 荐读|我国的大数据战略与“一带一路”的完美融合

    一 我国的大数据战略 近年来,对大数据的定义较为多样。第462次香山会议 (2013年5月29日—31日)提出了大数据通俗的定义:大数据是数字化生存时代的新型...

    灯塔大数据
  • 【CDAS 2017】互联网大数据分论坛:智慧互联网,数据展未来

    作者 CDA 数据分析师 前言 2017年7月29日,由CDA数据分析师主办,以“跨界互联 数据未来”为主题的CDAS 2017第四届中国数据分析师行业峰会...

    CDA数据分析师
  • 91科技集团董事长许泽玮:5G时代下,大数据将是技术红利释放的第一高地丨金猿人物展

    本文由许泽玮撰写并投递数据猿参与评选,更多关于【金猿榜/奖·2019征集评选】的相关信息,请点击这里了解详情丨征案例、征文章、征产品=评企业、评人物、评产品。

    数据猿

扫码关注云+社区

领取腾讯云代金券