来源:medium
编译:张睿毅、曹培信
自2012年起,一直被称为“最性感的工作”的数据科学家职位,吸引了大批远渡重洋到达硅谷,做着“数据梦”的留学生们。
但他们也付出了不菲的前期投入,除了时间精力,要拿到一个数据科学相关学位并顺利留在硅谷大厂,学费生活费培训费少说要几十万。
那么,顺利留在美国的数据科学家们,一年究竟能赚多少钱呢?
一位名叫Tony Yiu的数据科学家就想统计一下,在美国做数据分析师,到底收入如何?
Tony统计收入的方式很特别,不是用招聘数据,而是通过美国H1B(美国最主要的工作签证),作为公开的工资数据,进行了一个数据分析。他爬取了2014年到2019年6年的H1签证的职位和工资数据,想要了解一下,在美国工作的外籍数据科学家的年薪究竟怎么样。
下面文摘菌就带大家一起看看,去美国当数据科学家一年能赚多少钱!
首先,分析数据来源于h1bdata网站上的工资数据,该网站为劳工部(DOL)的劳动条件申请(LCA)数据的编制索引。基本上,当公司打算雇用需要H1B签证的员工时,他们需要在提交H1B签证申请之前向DOL提交LCA。此LCA包含公司、薪水和职位名称等公开数据。
数据链接:
https://h1bdata.info/index.php
我只搜索了美国西海岸的区域,因为我生活在那里:
此外,我将此分析仅关注于数据科学家。因此,这种分析不包括更高阶的数据科学职位,如高级数据科学家或员工数据科学家,也不包括数据分析师。
最后,请注意这是与H1B相关的薪资数据,因此,我用于分析的薪资数据不包括美国公民的收入。由于我没有看到任何相反的证据,我将假设美国公民数据科学家和持有绿卡的数据科学家的数据遵循都与H1B数据大体是相同的。
项目Github链接:
https://github.com/yiuhyuk/ds_salary_h1b
数据爬完了,话不多说,直接上分析结果。
数据科学家年收入中位数(美元)
从2014年到2019年,数据科学家的年薪中位数为120,000美元。正如上图所示,当我们逐年分析时,年薪中位数趋势相当平稳,且稳定在120,000美元左右。
但是,这个中位数只是基本工资,不包括现金奖励,股权和福利。因此,数据科学家的总薪酬中位数很可能更高。
在过去的5年中,在美国从事数据科学工作的人数大幅增加。2019年刚到8月,人数也已经超过2018年的2/3。
每年入职的数据科学家数量(H1B)
数据科学现在绝对是一个时髦的专业,我个人认为,过去几年雇用的数据科学家的上升也反映了另一个因素——很多公司都试图紧跟大数据和AI浪潮。
因此,这些以前称为决策分析或研究的公司的团队正在重新命名为数据科学,包括几年前曾被称为研究分析师的角色现在也被称为数据科学家。
这并没有什么不妥,所以数据科学家的头衔没有什么神圣之处,如果你能够应用量化数据来帮助你的企业做出更好的决策,那么你就是一名数据科学从业者!
图片来源:Pexels
但并非所有数据科学工作都是相同的。A公司的数据科学家可能将80%的时间花在SQL上,而B公司的数据科学家则花费一整天的时间在Python中实现机器学习算法。
数据科学家的工作范围如此之广,也可能是数据科学家工资表现出如此高差异的原因之一(其他明显的原因是工作经验、地点、公司的平均薪酬水平以及员工学位)。
通过直方图来看看薪水的分布情况。由于薪水分布在不同年份比较相近,因此在下面的直方图中绘制了所有5年的数据。两条黑线显示下四分位数($102,600)和上四分位数($135,475)的薪水,红线显示中位数($120,000)。
数据科学薪资直方图
可以用箱形图来比较年薪的工资分布:
数据科学家年度薪资的箱形图
作为参考,在2015年,工资四分位数值为:
现在为2019年,同样的四分位数值为:
所以工资确实有所上升,但并不明显。此外,截至本文撰写时,2019年数据科学家的工资与2018年相比有所下降。
但是同为数据科学家,最高薪水和最低薪水的差却着实不小,而且有增大的趋势,2015年最高年薪和最大年薪相差将近95,000美元,到2019年这个差值达到了135,000美元。
那么去哪里做数据科学家能赚大钱?下图是按公司从最高到最低排名的数据科学家薪酬表(按中位数)。在此图表中,只包括在聘请了10位或更多数据科学家的公司,所以如果只雇用一位孤独的数据科学家的公司,即使这个人一年赚了20万美元,也不会统计在内。
数据显示,AirBnB、Lyft、Facebook、Apple都有着超过135,000美元的年薪。出人意料的是,Ancestry是给数据科学家开的年薪也很高,同时没想到的是沃尔玛,原来超低价不意味着工资超低。
各大公司数据科学家薪酬表
下图中绘制的是数据科学家(提交H1B申请较多的企业)的大雇主的名单。
正如预期的那样,顶尖公司会雇佣更多的数据科学家。然而令人意外的是谷歌,谷歌在雇主数据库中显示没有太多的数据科学家,原因可能是Google使用的职位头衔不同。