文章/答案/技术大牛

发布

问开源MLaaS
EN

Software Recommendation用户

提问于 2014-05-02 19:03:56

回答 1查看 667关注 0票数 2

我正在寻找一个程序，我可以部署在我的计算机上，甚至更好地在我自己的集群(亚马逊EC2，OpenStack等)。这将提供机器学习作为服务 (MLaaS)。理想情况下，该程序将是免费的和开放的源代码。

简单地说，该程序将以一些数据集作为输入，并尝试一系列不同的机器学习算法(如NB、KNN、ANN、SVM、DT等)。在不同的参数(聚类/神经元/层数、激活函数、使用的度量、正则化等)下，输出所发现的最优模型。(最好使用一些常用的度量标准来定义，如准确性、ROC的AUC、F1等)。

我知道用一些现有的库(如科学知识-学习 )测试一组不同的模型很容易，但我正在寻找一种解决方案，它不需要或极小的编码，并且可以尽可能并行(多CPU/GPU)和可分布(可在计算机集群上部署)。

machine-learning

回答 1

Software Recommendation用户

发布于 2014-06-15 15:44:55

来自Quora：

加州大学伯克利分校( UC Berkeley)正在开发一个名为MLbase的项目。它的设计考虑了分布式计算，另一个目标是自动(而且有些高效)尝试许多不同的算法和超参数。据我所知，第二件事(他们称之为ML优化器)还没有准备好。就目前而言，你可能会发现，如果你决定推出自己的模型搜索方案，它们的Scala/Spark分布式算法实现可能会很有用。

在他们的网站上有更详细的内容：

MLlib:针对Spark运行时编写的分布式低级别ML库，可以从Scala和Java调用。该库包括常用的分类算法、回归算法、聚类算法和协同过滤算法。
MLI:一个用于特征提取和算法开发的API /平台，它引入了高级ML编程抽象。MLI目前是针对Spark实现的，在可能的情况下利用MLlib中的内核，尽管可以在任何支持这些抽象的运行时引擎上执行针对MLI编写的代码。MLI包含了比MLlib更广泛的功能和更快的开发周期。
ML优化器:这个层的目的是通过自动完成模型选择的任务来简化最终用户的ML问题。优化器解决了MLI中包含的特征提取器和ML算法的搜索问题。

MLI和MLlib的源代码已经发布，但ML优化器正在积极开发中，我看不到下载它的任何地方(因为ML优化器是符合OP要求的层)，这是很烦人的。整个MLbase框架依赖于阿帕奇火花 (免费的、开源的)。除了其他一些有用的模块之外，还可以将MLlib视为其之上的一个模块：

MLlib适合Spark的API，并与NumPy进行互操作(从Spark0.9开始)，并且Spark可以在EC2、Mesos或Hadoop上独立运行。

MLlib用户指南列出了所有受支持的机器学习模型：

在MLbase上有很多出版物：

E. Sparks，A. Talwalkar，V. Smith，J. Kottalam，X. Pan.J. Gonzalez，J. Gonzalez，M. Franklin，M. I. Jordan，T. Kr什卡。MLI:分布式机器学习的API。数据挖掘国际会议，2013年。(pdf格式)
J.Duchi，R. Griffith，M. Franklin，M.I. Jordan。MLbase:一个分布式机器学习系统。创新数据系统研究会议，2013年。(pdf格式)
A. Talwalkar，T. Kraska，R. Griffith，J. Duchi，J. Gonzalez，D. Britz，X. Pan，V. Smith，E. Sparks，A. Wibisono，M. J. Franklin，M. I. Jordan。MLbase:一个分布式机器学习包装器。在NIPS的大型学习研讨会上，2012年。(pdf格式)

票数 2

页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://softwarerecs.stackexchange.com/questions/3806

复制

相似问题

问开源MLaaS
EN

回答 1

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问开源MLaaSEN

回答 1

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问开源MLaaS
EN