对于机器学习,到底该选择哪种编程语言?

开发者到底应该学习哪种编程语言才能获得机器学习或数据科学这类工作呢?这是一个非常重要的问题。我们在许多论坛上都讨论过这个问题。今天,我将给出我自己的答案并解释其中原因,但我们首先看一些数据。毕竟,这是机器学习者和数据科学家应该做的事情:看数据,而不是看观点。

让我们看一些数据。我将在Indeed.com上使用趋势搜索,它可以根据时间搜寻实际工作机会中特定的条款。这表明了雇主们正在寻找拥有该技能的人才。然而,请注意,这并不是一项有效使用技能的民意调查,这种指标更能体现技能的受欢迎程度。

话不多说,上数据。我搜索关键词“机器学习”和“数据科学”一,搜索选项包括编程语言Java、C、C+++、JavaScript,还包括了Python和R,因为我知道它在机器学习和数据科学方面很受欢迎,当然还有Scala,考虑到它与Spark的关系,再加上Julia,一些开发者认为这是编程界的“the next big thing”。运行这个查询,我们得到的数据如下:

然后,我用关键词“机器学习”重新搜索时,又得到了类似的数据,如下:

那么,我们能从这些数据中得到什么启示呢?

首先,我们看到并不是“一招通吃”。在这种情况下,各种机器学习编程语言都很受欢迎。

其次,所有这些编程语言都在急剧增长,反映在过去几年里,企业对机器学习和数据科学的关注和需求正在急速增加。

第三,Python明显领先其它编程语言,其次是Java,然后是R,再然后是C++。Python对Java的领先优势正在增加,而Java在R上的领先地位正在下降。必须承认,我很惊讶地看到Java名列第二;我本来是以为是R语言。

第四,Scala的增长令人印象深刻。它在三年前几乎是不存在的,现在和这些成熟的编程语言几乎在同一个层面。当我们切换到Indeed.com上的数据的相对视图时,这更容易发现。

第五,Julia的受欢迎程度虽然不明显,但肯定有上升的趋势。Julia将成为一种流行机器学习和数据科学编程语言吗?未来会告诉你。

如果我们忽略Scala和Julia,以便能够聚焦其他编程语言的增长,那么我们毫无疑问可以确认:Python和R的增长速度要快于通用语言。

考虑到增长率的差异,R的受欢迎程度可能很快就会超过Java。

当我们专注于深度学习这个问题时,数据是完全不同的:

这时,Python仍然是领导者,但C++现在是第二,然后是Java,而C在第四,R只在第5。这里显然强调了高性能计算语言。Java正在快速发展。它可以很快达到第二名,就像一般的机器学习一样。R不会很快接近顶部。令我惊讶的是Lua的缺席,尽管它在一个主要的深度学习框架(orch)中使用,而Julia不存在。

到这时,到底哪种语言才是最受欢迎的编程语言呢?答案应该很清楚了。当涉及到机器学习和数据科学工作时,Python、Java和R是最流行的技能。如果你想专注于深度学习,而不是一般的机器学习,那么,在某种程度上来说C++、C也是值得考虑的。然而,请记住,这只是看待问题的一种方式。如果你想找一份工作,或者你只是想在业余时间学习机器学习和数据科学,你可能会得到不同的答案。

我的个人答案呢?除了有许多顶级机器学习框架的支持之外,Python对我来说很适合,因为我有计算机科学的背景。对于开发新的算法,我也会感到很舒服,因为我的大部分职业生涯都是用这种语言编程的。但这就是我,有不同背景的人可能会觉得用另一种语言更好。一个拥有有限编程技能的统计学家肯定会更喜欢R。一个强大的Java开发人员可以使用他最喜欢的语言,因为有大量的Java API的开放源代码。对于这些图表上的任何一种语言,都可以有类似的例子。

因此,我的建议是,在花大量时间学习一门语言之前,根据自己的情况来决定选择哪种编程语言,切记千万不可跟风。

参考链接:Indeed.com

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2017-11-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据猿

神策数据创始人兼CEO桑文锋:大数据分析的四个重要环节(内附视频&PPT)

数据猿导读 在“硅谷之声——大数据技术达人中国行专场”上,神策数据创始人兼CEO桑文锋表示,在百度工作这么多年,“要把数据的事情做好”是我非常重要的一个心得。数...

3517
来自专栏机器学习算法与Python学习

A new generation of cloud brain robot

大脑一直是机器人开发的关键,无论是硬件功能还是软件的进步,都能够使的机器人有更强的计算能力。但机器人“脑”内的内容仍然是个难题,美国的几所科技名校正在联合打造“...

2784
来自专栏大数据文摘

业界 | 数据科学简历通关指南,一文告诉你HR青睐哪些特质

1093
来自专栏华章科技

为什么你的数据分析成果总是难以落地?

为什么你的数据分析成果总是难以落地?数据分析的价值总是远远低于预期?相信看完这篇文章,每个人都能找到一个属于自己的答案。以下为从事电力、军工、金融等行业担任数据...

722
来自专栏Android 研究

PMI-ACP 敏捷项目管理2——敏捷12原则

在软件项目或者其他类型的有高变更比率的项目而言,严格的变更管理流程会带来很多问题。相比而言,敏捷项目管理允许变更的发生,比如极限变成(XP)提倡"拥抱变化"。敏...

4283
来自专栏华章科技

你的KPI?是你的KPI

在互联网公司里,大家可能对自己的KPI都了如指掌,却不一定了解其他部门的具体职责和其相应的KPI。适当了解其他部门的KPI,有利于更有效地理解对方的办事逻辑,同...

1001
来自专栏大数据挖掘DT机器学习

浅析数据化设计思维在阿里系产品的应用

1、做设计为什么还需要看数据? 很多设计师从来不看数据,要么是因为没有数据可看,要么是根本不想看,但是也一样把设计做的很好啊!设计本来就是有感性的一面,为什么...

3714
来自专栏云计算D1net

让云计算对企业更加友好

如今,随着企业变得越来越习惯采用云计算,并了解其如何能够增加业务机会,他们将信息越来越多的数字资产投入云基础设施。在过去,企业还没有准备好全面承诺采用云计算,往...

42911
来自专栏技术与生活

运营是什么——《运营之光》读书笔记

所以,一个真正意义上的“产品运营”,其实是一个综合能力比较均衡,既熟悉各类运营手段,又熟悉产品,甚至能够自己完成一些产品方案的人。

5382
来自专栏程序员笔记

团队合作

1814

扫码关注云+社区

领取腾讯云代金券