5种方式将机器学习带到Java、Python以及Go等编程语言

【编者按】机器学习似乎在一夜之间从默默无闻的小卒变成万众瞩目的焦点,关于机器学习的开源工具也越来越多,但是目前的挑战是,如何让对机器学习感兴趣的开发者和准备使用它的数据科学家们真正使用上它们,本文搜集了几种语言中常见且实用的开源机器学习工具,非常值得关注,本文来自 InfoWorld。

以下为原文:

经过几十年作为一门专业学科的发展后,机器学习似乎一夜之间作为万众瞩目的商业工具出现在我们面前。目前面临的挑战是如何让其具备实效,尤其是对开发者和正准备使用它的数据科学家们。

为此,我们搜集了一些最常见的且实用的开源机器学习工具,通过本文分享给大家。

Python

数据科学家们投身Python怀抱是希望有另一种更开放式的选择方案来替代R语言,如今许多雇主寻求大数据专家,而Python就是必需的技能。因此,大量的机器学习软件库开始出现在不断扩大的Python软件名单中。

首先推荐的是 scikit-learn,它能够加载至算法与模块当中,在GitHub(fork版本数量接近2000)上受到了广泛赞赏,并受到了许多科技巨头的青睐。另一个紧随其后的是 PyBrain,它的设计目的在于降低使用难度并提供与其它强大工具相对接的能力。顾名思义,PyBrain的关注重点在于神经网络与非监督式学习,它同时也提供一套用于培训与重新定义算法的机制。

Go

谷歌的系统语言,由于其并行设计,使其似乎是一个编写机器学习库理想的环境。虽然目前与之相关的库项目规模尚小,但也有一些值得关注, GoLearn,它的开发者将其描述为一个“内置电池”的机器学习库。它提供过滤、分类以及回归分析等多种工具。另一套较小且更为基础的库是mlgo,虽然目前它能提供的算法数量还非常少,但计划在未来推出更多。

Java on Hadoop

在人们喜爱的大数据框架中,Mahout(在印地语中意思是“大象骑士”)包含几种常见的机器学习方法。这款软件包是围绕算法而非方法,所以你需要有一定的算法基础,换言之,如果你足够认真,就肯定不难看出其各部分功能是如何整合在一起的,例如,你可以通过几行代码构建起基于用户的推荐系统。

另一个基于Hadoop的机器学习项目是Cloudera公司推行的Oryx,其特性在于通过交付实时流结果而非处理批量作业来对Mahout处理结果进行进一步分析。该该项目现在还处于初始阶段,注意,这只是个项目而非实际产品,但它在不断改善,所以很值得关注。

Java

除了上述主要针对Hadoop的Mahout,其他一些面向Java的机器学习库也在广泛使用。 Weka由新西兰怀卡托大学开发的工作台式的应用,它在常见的算法集合中增加了可视化和数据挖掘功能。对于那些想要为他们的工作打造一个前端或者计划将Java作为初始开发的用户来说,Weka可能是最好的选择。 Java-ML也不错,但它更适合那些已经习惯将Java和机器学习配合使用的开发者。

JavaScript

关于JavaScript的笑话(“阿特伍德定律”),原意是这样的,任何能够由JavaScript编写的内容最终都会由JavaScript编写,这对机器学习库同样适用。目前由JavaScript编写的方案在这一领域数量仍然相对较少,大多数选项仅仅是单一算法而非完整的库,但已经有部分有用工具渐渐脱颖而出。ConvNetJS允许大家直接在浏览器当中进行深度学习神经网络培训,而名为 brain则将神经网络作为可安装的NPM模块提供给大家。此外, Encog库同样值得关注,而且它适用于多种平台:Java、C#、C/C++以及JavaScript。

原文链接:5 ways to add machine learning to Java, JavaScript, and more (编译/魏伟 审校/仲浩)

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2015-03-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

还在看视频读文档学编程?这有7种编程学习方式,哪种最适合你?

15720
来自专栏FreeBuf

走近科学:隐藏在图像数据库中的安全问题

本文原刊登于IEEE IT Professional杂志。 由于系统改造的代价之高,使用适于系统设计的网络安全措施则是最好的选择。而新科技和应用则带来更多安全与...

227100
来自专栏熊二哥

项目管理快速入门02--“多快好省”

项目管理最重要的四个要素就是jd的口号,“多快好省”,当然这是不可能的,哈哈。 多:项目范围管理 快:项目时间管理 好:项目质量管理 省:项目成本管理 这部分内...

264100
来自专栏PPV课数据科学社区

【学习】干货收藏:如何进行大数据分析及处理?

众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 那么越来越多的应用涉及...

1K60
来自专栏量子位

百度让AI像婴儿一样学语言,还能举一反三听老师指挥走迷宫

李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI 把已经学会的技能用在新的任务上,对于人类来说是很简单的事,但这种“泛化”能力是机器所缺乏的。 百度...

34580
来自专栏深度学习与数据挖掘实战

程序员到机器学习工程师的飞跃

“我是一名软件开发工程师,阅读过一些关于机器学习方面的书籍和博客文章,也学习过一些在线的关于机器学习的公开课。但是,我仍然不知道怎么应用到工程实践中……”

11520
来自专栏AI科技评论

业界 | Facebook将反馈融入AI系统,视觉障碍者现在也能“读懂”照片啦

AI科技评论按:Automatic Alt-Text (AAT) 的发布让盲人(或使用屏幕阅读器的用户)更好地读懂新闻推送 (News Feeds) 里的照片...

31290
来自专栏SDNLAB

ATT计划推出6万台dNOS支持的白盒设备以实现5G

26060
来自专栏深度学习与数据挖掘实战

干货|程序员到机器学习工程师飞跃的实战经验

“我是一名软件开发工程师,阅读过一些关于机器学习方面的书籍和博客文章,也学习过一些在线的关于机器学习的公开课。但是,我仍然不知道怎么应用到工程实践中……”

12820
来自专栏TEG云端专业号的专栏

谈谈服务器运营领域的机器学习

本文我们来谈谈近几年机器学习在服务器运营领域的一些实践。

71180

扫码关注云+社区

领取腾讯云代金券