2017 年首份中美数据科学对比报告,美国数据工作者年薪中位数高达 11 万美金

导语

最新消息,Kaggle最近对机器学习及数据科学领域进行了全行业深度调查,调查共收到超过 16,000 份回复,受访内容包括最受欢迎的编程语言是什么,不同国家数据科学家的平均年龄是什么,不同国家的平均年薪是多少等。

不过,因为中国的数据收集不够全面,而美国数据也同样存在清洗不够的情况,所以,以下数据仅供参考。希望Kaggle下次能将数据做得更透彻更深入更全面。

以下为AI科技大本营对其进行的数据整理,并从中美数据科学和机器学习对比的角度呈现如下:

中美数据工作者概况对比

年龄

从世界范围来看,本次调查对象的平均年龄大约 30 岁,当然,这个值在各个国家之间有变动。

以下为中美调查对象的年龄对比:

中国

在中国,机器学习从业者年龄的中位数是25岁,从业者集中在20-30岁年龄段。这可能反映出中国从业者人群的大体分布,但鉴于Kaggle所统计到的数据量,其中的细节还值得商榷一番。

美国

在美国,机器学习从业者年龄的中位数是32岁,以20-30岁年龄段的人数最多。但令人意外的是,我们在图表中看到一位年满100岁的大牛,还有几位年龄接近0岁的小朋友。我们尚不清楚Kaggle这里数据清洗的细节,不过这几位大牛果真存在的话,务请联系AI科技大本营,我们对您的存在非常感兴趣。

中美就业状况对比

中国全职工作者占53.%%,美国则高达70.9%

中国

美国

中美数据科学具体职位对比图

数据科学领域可涵盖的工作非常多,包括机器学习工程师,数据分析师,数据科学家,软件开发人员,数据挖掘人员等。以下为中美在数据科学领域的对比图:

中国

美国

年薪

从全球来看,数据科学人员的年薪中位数为$55,441。在中国,数据科学家的年薪中位数为$29,835。美国则高达$110,000

中国全职年薪

美国全职年薪

最高学历

通常来讲,数据科学从业者中最普遍的学历是硕士,但一般来讲,博士学位能拿到($150K - $200K 和 $200k+)的高薪。

就中国而言,硕士学位在总体占比为40.5%,博士仅11.2%,本科学位从业人数则高达39.5%,与硕士从业人数持平。

而美国,硕士学位只有44.5%,博士学位高达20.7%,本科从业者占比也高达26.5%。

总的来说,美国博士学位高达20.7%,从占比上来看,接近中国的两倍(中国为11.2%)。

中国

美国

数据科学家到底是怎么工作的?

工作中使用什么样的方法?

Logistic回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络使用地更多。

所有国家整体数据

数据工作中使用最多的工具语言是?

总体来说,Python是数据工作者使用最多的语言。同时,数据研究人员对R语言的忠诚度也很高。

所有国家整体数据

工作中使用什么类型的数据?

关系型数据市是最常用的数据类型。但在学术研究者和国防安全领域则更亲睐文本和图像。

所有国家整体数据

工作中使用什么样的代码共享和托管方式?

大部分数据工作者使用Git分享代码。不过,大公司的工作者更喜欢将代码保留在本地,并将代码用邮件分享。初创公司则用更快捷的云分享方式。

所有国家整体数据

工作中遇到了什么样的障碍?

脏数据(Dirty Data)是最大障碍。机器有侧重,但理解不同算法的能力不够也是一大困扰数据工作者的障碍。缺乏有效管理和资金支持是数据工作者面临的两大外在困境。

数据科学新手如何在这个行业崭露头角?

根据你的经验,你会向数据科学新手推荐使用哪种语言?

这个因人而异。在Python和R两大使用群体最大的语言中,大部分人觉得Python更值得被推荐。

你从哪里获得数据科学的学习资源?

数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。Stack Overflow Q&A,Conferences,和Podcasts是已从业者经常使用的学习平台。发布新软件时,一定记住阅读官方使用指南,并推荐去YouTube观看使用视频。

从哪里获得开放数据集?

没有数据就没有数据科学!当涉及到一些数据科学技巧时,知道如何找到练习所用的干净的开源数据集和项目非常重要。越来越多人开始使用我们的数据集聚合器(https://www.kaggle.com/datasets ).

通过什么渠道获得工作?

根据数据科学领域过来人的经验,以下这些方法可能会比在公司网站,招聘网站上投递简历更高效,比如通过建立自己在这个行业的关系网络。

以上内容来自于kaggle网站。

本来来源于 AI科技大本营 微信公众号

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

到底有多少种「搞数据的」,你凌乱过吗?

好吧,我承认有点标题党了。我的本意是想写写,到底有多少类做数据相关工作的,以及数据从业者的职业发展路径可能有哪些。

441
来自专栏孟永辉

马云退休,一个全新的互联网时代或将开始

今天,马云退休的消息无疑是一个焦点。对于马云退休的原因,外界依然有很多的猜测。几乎可以确定的是,未来马云将会从事自己心仪的教育事业,并将会持续发挥自己在教育事业...

712
来自专栏人工智能头条

徐扬生院士:机器人应该具备三种能力 智能动作更重要

1335
来自专栏灯塔大数据

每周学点大数据 | No.49 维基百科的策略中体现的“众包算法”的思想

No.48期 众包的定义 Mr. 王:平常遇到不知道的概念或者名词,你一般会怎么办? 小可:有维基百科啊,我去查一查就知道了。对于一个名词,维基百科能给出很多...

3014
来自专栏镁客网

分数出炉!吊炸天的人工智能竟被高考秒成渣

1134
来自专栏悦思悦读

什么是数据科学

本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【1】部分。 分享主题:Data Science学习分享会 分享时间:2016年4月18日晚8:00-...

36415
来自专栏PPV课数据科学社区

【教育部出大招】人工智能进入全国高中新课标,2018秋季学期执行

? 【导读】1月16日上午,教育部召开新闻发布会,介绍了《普通高中课程方案和语文等学科课程标准(2017年版)》的有关情况。在此次“新课标”改革中,正式将人工...

3204
来自专栏AI科技大本营的专栏

2017年首份中美数据科学对比报告,Python受欢迎度排名第一,美国数据工作者年薪中位数高达11万美金

最新消息,Kaggle最近对机器学习及数据科学领域进行了全行业深度调查,调查共收到超过 16,000 份回复,受访内容包括最受欢迎的编程语言是什么,不同国家数据...

3527
来自专栏CDA数据分析师

经验|怎么写好一份数据分析报告?

分析报告的输出是你整个分析过程的成果,是评定一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据。 ? 我认为一份好的分析报告,有以下一些要点: 首先,...

1925
来自专栏ATYUN订阅号

DeepMind AI新技能——“睡觉”!

根据外国媒体报道,谷歌在人工智能领域绝对是当之无愧的佼佼者。当谷歌的AI–AlphaGo击败了人类顶尖棋手的时候,举国皆知,可以说是震惊了全世界。现在,又让AI...

3648

扫码关注云+社区