我知道H20是在星火环境下执行的,所以它可以使用火花引擎(和所有的星火分布式结构)来分配计算,但是就性能而言,H2O已经是一个分布式和可伸缩的机器学习库了。
而且,独立版本的H2O真的能够管理计算机集群上的分布式处理吗?
发布于 2017-12-19 21:32:11
与常规H2O相比,使用起泡水的主要好处是它非常适合现有的火花管道。如果您还没有使用Spark,那么最好只使用常规的H2O库。H2O已经是分布式的,因此在方程中添加Spark并不会在分布式计算方面提供任何附加值。
H2O有许多与Spark相同的组件,例如分布式数据帧和共享内存计算。因此,是的,H2O能够在多核或多节点计算机集群上管理分布式处理。这正是它设计的目的。
https://stackoverflow.com/questions/47894205
复制相似问题