首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从机器学习算法看h2o.ai和SparkMLlib的区别

从机器学习算法看h2o.ai和SparkMLlib的区别
EN

Stack Overflow用户
提问于 2016-12-09 06:00:45
回答 1查看 2.1K关注 0票数 0

目前,我正在使用h2o.aiSparkMLlib对机器学习库进行调查。我发现h2o.ai库比SparkMLlib支持更多的ML算法,而将Spark数据帧划分到训练和测试集似乎很困难(需要将spark数据帧转换为R/h2o数据帧,这也是一种耗时/资源消耗的方法)。

与基于R的实现( h2o.ai SparkMLib ,SparkR)相比,使用库还有哪些优点/缺点?,我正在将h2o.aiSparkMLlib集中到基于R的实现(SparkR)中。因此,h2o (as.h2o)和SparkMLlib (as.DataFrame)的数据格式是不同的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-12-09 07:07:37

部分地,我使用以下链接计算出答案:http://datasocial.onsocialengine.com/post/4171645/spark-mllib-or-h2o

详细的比较分析如下:https://github.com/szilard/benchm-ml

台架评分结果幻灯片:https://speakerdeck.com/szilard/benchmarking-machine-learning-tools-for-scalability-speed-and-accuracy-la-ml-meetup-at-eharmony-june-2015

台架标识结果视频:https://vimeopro.com/eharmony/talks/video/132838730

机器学习库分析技术报告:https://github.com/chauhansaurabhb/Analysis-of-H2O-vs-SparkMLlib/blob/master/MLLibrary.pdf

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41054025

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档