文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将数据从一个集群获取到另一个集群中？

问如何将数据从一个集群获取到另一个集群中？
EN

Stack Overflow用户

提问于 2022-07-11 11:38:30

回答 2查看 71关注 0票数 0

我在我的jupyter笔记本中创建了第一个集群：

from dask.distributed import Client, LocalCluster
cluster = LocalCluster(name='clus1',n_workers=1,dashboard_address='localhost:8789')
client = Client(cluster)

然后用熊猫阅读我的数据。并做了一些预处理。

在那之后，我在第二本笔记本上创建了第二组。

from dask.distributed import Client, LocalCluster
cluster = LocalCluster(name='clus2',n_workers=1,dashboard_address='localhost:8790')
client = Client(cluster)

现在，我想将数据从一个集群获取到另一个集群。

有什么办法可以绕过吗？

jupyter-notebook

parallel-processing

cluster-computing

dask

distributed-computing

Stack Overflow用户

发布于 2022-07-12 02:55:33

正如@mdurant在注释中所指出的，另一个选项(如果适用于当前问题)是重用同一个集群：

from dask.distributed import Client, LocalCluster
cluster = LocalCluster(name='clus1',n_workers=1,dashboard_address='localhost:8789')
client = Client(cluster)
client.write_scheduler_file('tmp_scheduler.dask')

然后，在相关部分中，您可以连接到集群(从多个笔记本)：

from dask.distributed import Client
client = Client(scheduler_file='tmp_scheduler.dask')

这避免了在集群之间传输文件的需要(因为数据位于同一集群上)。

票数 1

查看全部 2 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72937980

复制

相似问题

问如何将数据从一个集群获取到另一个集群中？
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将数据从一个集群获取到另一个集群中？EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将数据从一个集群获取到另一个集群中？
EN