【陆勤推荐】人工智能和机器学习领域中有趣的开源项目

本文简要介绍了10款 Quora上网友推荐的 人工智能和机器学习领域方面的开源项目。

GraphLab

  GraphLab是一种新的面向机器学习的并行框架。GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从别的应用程序或者服务中抓取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序。(详情 )

  项目主页: http://graphlab.org/

Vowpal Wabbit

  Vowpal Wabbit (Fast Online Learning)最初是由雅虎研究院建设的一个机器学习平台,目前该项目在微软研究院。它是由John Langford启动并主导的项目。

  项目地址: http://hunch.net/~vw/

scikits.learn

  scikit-learn是一个开源的、构建在SciPy之上用于机器学习的 Python 模块。它包括简单而高效的工具,可用于数据挖掘和数据分析,适合于任何人,可在各种情况下重复使用、构建在 NumPy、SciPy和 matplotlib之上,遵循BSD 协议。( 详情 )

  项目地址: http://scikit-learn.org/stable

Theano

  Theano是一个python库,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题。它使得写深度学习模型更加容易,同时也给出了一些关于在GPU上训练它们的选项。( 详情 )

  项目地址:http://deeplearning.net/software/theano/

Mahout

  Mahout 是Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用Apache Hadoop 库,Mahout 可以有效地扩展到云中。

  项目主页: http://mahout.apache.org/

pybrain

  pybrain是Python的一个机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。pybrain包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例。

  项目主页: http://pybrain.org/

OpenCV

  OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。(详情 )

  项目主页: http://opencv.org/

Orange

  Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

  项目主页: http://orange.biolab.si/

NLTK

  NLTK(naturallanguage toolkit)是python的自然语言处理工具包。2001年推出,至今发展非常活跃。它的主要作用是为了教学,至今已经在20多个国家60多所高校使用,里面包括了大量的词料库,以及自然语言处理方面的算法实现:分词, 词根计算, 分类, 语义分析等。

  项目主页: http://nltk.org/

Nupic

  Nupic是一个开源的人工智能平台。该项目由Grok(原名 Numenta)公司开发,其中包括了公司的算法和软件架构。 NuPIC 的运作接近于人脑,“当模式变化的时候,它会忘掉旧模式,记忆新模式”。如人脑一样,CLA 算法能够适应新的变化。( 详情 )

  项目主页: http://numenta.org/nupic.html

  以上是小编整理的10款人工智能和机器学习领域的开源项目。更多项目可参看这个列表:

http://deeplearning.net/software_links/

本文分享自微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-08-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能

机器学习教程:朴素贝叶斯文本分类器

在本教程中,我们将讨论朴素贝叶斯文本分类器。朴素贝叶斯是最简单的分类器之一,只涉及简单的数学表达,并且可以使用PHP,C#,JAVA等语言进行编程。

33590
来自专栏腾讯研究院的专栏

2015年腾讯研究院年会发布《腾讯“互联网+”指数》报告

?  “互联网+”已然成为了时下最热门的词语之一,克强总理带头,各行各业都在热议“互联网+”。我国31个省/自治区/直辖市(港澳台地区数据未统计),351个...

21780

调整渐变下降的学习率

在大多数监督性机器学习问题中,我们需要定义一个模型并基于训练数据集预估其参数。计算这些参数的广泛且容易使用的一个技术是通过梯度下降来最小化模型的误差。梯度下降通...

28180
来自专栏人工智能

迁移学习 - 机器学习的下一个前沿

近年来,我们在训练深度神经网络从大量的标记数据(图片、句子、标签预测等)中获取非常精确的输入输出映射关系上取得了巨大的进展。

1.1K60
来自专栏非著名程序员

编程王道,唯“慢”不破

? 编程王道,唯“慢”不破 人和人之间编程速度的差异还是很大的,有的程序猿写代码非常快,有的却常常是龟速。Jeffrey Ventrella最近在一篇文章里探...

22480

自然语言处理指南(第四部分)

请务必首先检查第1部分,第2 部分和第3部分!

22680
来自专栏人工智能

人工智能应该成为促进教育的良药

人工智能的飞速发展对于教育而言的确是现实版的“狼来了”,其应对良策绝不是陷于生存焦虑中而自怨自艾,而应是基于危机意识的不断反思,并逐步走向自我完善,让人工智能成...

20960
来自专栏人工智能

Apache Spark 2.0预览:机器学习模型持久性

以上所有应用场景在模型持久性、保存和加载模型的能力方面都更为容易。随着Apache Spark 2.0即将发布,Spark的机器学习库MLlib将在DataFr...

53580
来自专栏腾讯研究院的专栏

人工智能产业展望:2018年三大难题如何破解?

展望2018,偌大一个人工智能,优秀项目不够、顶尖人才不足、场景落地缺缺,三大难题横亘眼前,又将如何破解?

97190
来自专栏人工智能

MLlib中的随机森林和提升方法

本帖是与来自于Origami Logic 的Manish Amd共同撰写的。

349100

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励