首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Apache 3是否支持将GPU用于Spark?

Apache 3是否支持将GPU用于Spark?
EN

Stack Overflow用户
提问于 2021-09-21 17:32:56
回答 1查看 416关注 0票数 2

我目前正在使用冰雹(用python和Scala编写的基因组分析库)运行基因组分析管道。最近,Apache 3发布,它支持GPU的使用。

我尝试了火花急流库,用gpu节点启动了一个前提下的slurm集群。我能够初始化集群。然而,当我试着执行冰雹任务时,执行者总是被杀死。

在冰雹论坛上,我得到了这样的回应:

这是一个用于Spark的GPU代码生成器,Hail不使用任何Spark接口,只使用RDD接口。

那么,Spark3不支持RDD接口的GPU使用吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-09-23 05:53:16

到目前为止,星火激流并不支持RDD接口的GPU使用。

来源:链接

Apache允许用户提供一个插件,可以替换用于3.0+和DataFrame操作的后端。这不需要用户更改API。这个插件将用GPU加速版本取代它支持的SQL操作。如果一个操作不受支持,它将返回到使用Spark版本。请注意,插件不能加速直接操作RDD的操作。

在这里,火花激流小组给出了答案

来源:链接

我们目前不支持在GPU上运行RDD。我们只支持SQL/Dataframe,甚至只支持操作符的一个子集。这是因为我们正在将单个催化剂操作符转换为启用GPU的等效操作符。我希望能够支持RDD API,但这需要我们能够获取任意的java、scala和python代码,并在GPU上运行它。我们正在研究实现其中一些目标的方法,但现在很难做到。对于像Hail这样使用python作为API的库来说尤其如此,但是数据分析是用C/C++完成的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69273205

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档