人工智能和机器学习领域中10个开源项目

GraphLab

GraphLab是一种新的面向机器学习的并行框架。GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以 分析产品,该公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从别的应用程序或者服务中抓 取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序。( 详情 )

项目主页: http://graphlab.org/

Vowpal Wabbit

Vowpal Wabbit (Fast Online Learning)最初是由雅虎研究院建设的一个机器学习平台,目前该项目在微软研究院。它是由John Langford启动并主导的项目。

项目地址: http://hunch.net/~vw/

scikits.learn

scikit-learn是一个开源的、构建在SciPy之上用于机器学习的 Python 模块。它包括简单而高效的工具,可用于数据挖掘和数据分析,适合于任何人,可在各种情况下重复使用、构建在 NumPy、SciPy和 matplotlib 之上,遵循BSD 协议。( 详情 )

项目地址: http://scikit-learn.org/stable

Theano

Theano是一个python库,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题。它使得写深度学习模型更加容易,同时也给出了一些关于在GPU上训练它们的选项。( 详情 )

项目地址: http://deeplearning.net/software/theano/

Mahout

Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚 类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

项目主页: http://mahout.apache.org/

pybrain

pybrain是Python的一个机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。pybrain包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例。

项目主页: http://pybrain.org/

OpenCV

OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。( 详情 )

项目主页: http://opencv.org/

Orange

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

项目主页: http://orange.biolab.si/

NLTK

NLTK(natural language toolkit)是python的自然语言处理工具包。2001年推出,至今发展非常活跃。它的主要作用是为了教学,至今已经在20多个国家60多所高校 使用,里面包括了大量的词料库,以及自然语言处理方面的算法实现:分词, 词根计算, 分类, 语义分析等。

项目主页: http://nltk.org/

Nupic

Nupic是一个开源的人工智能平台。该项目由Grok(原名 Numenta)公司开发,其中包括了公司的算法和软件架构。 NuPIC 的运作接近于人脑,“当模式变化的时候,它会忘掉旧模式,记忆新模式”。如人脑一样,CLA 算法能够适应新的变化。( 详情 )

项目主页: http://numenta.org/nupic.html

以上是小编整理的10款人工智能和机器学习领域的开源项目。更多项目可参看这个列表: http://deeplearning.net/software_links/

摘自:驱动中国网,51CTO

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-12-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

先进传感技术简化机器人设计制造过程

过去,机器人制造是一个非常困难、容易出错且耗时的过程,因为采用由分立元件构成的装置实现对环境的感应,而这些装置中很多部件都不能有效地协同工作,处理器缺乏足够的能...

37260
来自专栏数据科学与人工智能

【大数据分析】大数据分析方法 及 相关工具

要知道,大数据已不再是数据大,最重要的现实就是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 越来越多的应用涉及到大数据,这些大数据的...

44080
来自专栏java工会

收集和存储数据——数据仓库

数据产品的工作比较杂,从数据仓库建模,指标体系建立,到数据产品工具的设计,再到偶尔一些数据分析报告的撰写,甚至一些机器学习的预测模型都要有所了解。大公司可能每个...

13600
来自专栏数据的力量

说说网站用户的生命周期价值

16640
来自专栏TEG云端专业号的专栏

何维兵:大型DCI网络智能运营实践

做运营的同学,都有同样的感受,既希望被老板关注,又不希望被老板关注!因为觉得被老板关注时,常常是没什么好事发生。记得微信红包兴起时,有一次我们网络运营就有幸得到...

43530
来自专栏美团技术团队

美团点评运营数据产品化实战

背景 美团点评作为全球最大的生活服务平台,承接超过千万的POI,服务于数量庞大的活跃用户。在海量数据的前提下,定位运营业务、准确找到需要数据的位置,并快速提供正...

577110
来自专栏Hadoop数据仓库

DW、OLAP、DM、DSS 的关系

DW:    Data Warehouse                     数据仓库     OLAP:  On-Line Analytical Pro...

25280
来自专栏跟着阿笨一起玩NET

推荐几款软件界面模型设计工具

界面模型设计中很实用的一个工具GUI Design Studio,可以让界面示意图实现基本的交互,便于演示、交流。 GUI Design Studio提供的了...

72110
来自专栏VRPinea

谷歌Poly发布新API,开发者将可在VR中寻找3D资源

28460
来自专栏大数据文摘

Booking.com的A/B测试实践

283100

扫码关注云+社区

领取腾讯云代金券