腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Dask
分布式
工作
线程
在
运行
许多
任务
时
总是会
泄漏
内存
、
distributed.worker -警告-
内存
使用率较高,但
工作
进程没有要存储到磁盘的数据。也许其他进程正在
泄漏
内存
?进程
内存
: 26.17 GB --
工作
内存
限制: 32.66 GB 基本上,我只是
在
单机上
运行
许多
并行作业,但只是一个
任务
调度程序,并尝试了各种数量的工人。每当我启动大量作业
时
,随着时间的推移,
内存
会逐渐上升,只有当我反弹集群
时</em
浏览 20
提问于2019-10-08
得票数 1
1
回答
dask
分布是否使用“龙卷风协同”来执行员工
任务
?
、
、
、
、
我
在
达克上读到: Worker节点和Scheduler节点同时
运行
。它们为多个重叠请求提供服务,同时
在
不阻塞的情况下执行多个重叠计算。我一直认为单
线程
并发编程最适合于昂贵的I/O,而不是CPU绑定的作业。然而,我希望
许多
dask
任务
(例如
dask
.pandas、
dask
.array)都是CPU密集型的。
分布式
系统是否只对客户端/服务器通信使用旋风,并有单独的进程/
线程
浏览 3
提问于2016-10-04
得票数 4
回答已采纳
1
回答
为什么多处理比Pandas中的简单计算要慢?
、
、
、
、
这与有关import
dask
.dataframe as ddimport
dask
.threadedmaster] * 100, ignore_index = True)首先,我尝试了
dask
dmaster.original.apply(lambda x: helper(x, slave),meta=(
浏览 1
提问于2018-04-15
得票数 3
回答已采纳
1
回答
Dask
工作
进程
内存
不断增长
、
我正在
dask
分布式
,tensorflow,keras设置上优化ML模型。
工作
进程在
内存
中不断增长。我不想每次
内存
满
时
都重新启动,因为这会使操作停止一段时间,从而导致延迟。唯一的解决
浏览 1
提问于2018-04-07
得票数 1
1
回答
Dask
distributed -创建
工作
者的指南
、
我刚接触
dask
,
在
设置
dask
分布式
集群
时
,我不确定这样做的最佳实践是什么。
在
设置
工作
进程
时
,让两个
工作
进程都有4 1GB的
内存
,还是让8个
工作
进程都有1 1GB的
内存
更有效率?另外,当
工作
线程
的数量增加
时
,我们还需要增加调度器的
内存
吗?
浏览 12
提问于2019-08-14
得票数 1
2
回答
嵌套的
dask
.compute不阻塞
、
、
、
然而,当我嵌套了
dask
.compute,并且内部的
dask
.compute执行I/O (如
dask
.dataframe.read_parquet)
时
,内部的and不是阻塞的。2个
工作
者,每个
工作
者有8个进程,如下所示:,那么我预计最多会有2 x8个并发文件
运行
,因为inner_func (Inner_func)
浏览 11
提问于2017-08-10
得票数 0
1
回答
如何使简单的函数--最大值、平均值和数据选择--
在
达斯克比熊猫跑得更快?
、
、
这可能是
内存
效率高,但一个简单的基准测试给我的达斯克比熊猫的速度。import numpy as npimport
dask
.dataframe as dd return df['fare'].mean() def ge
浏览 0
提问于2019-02-17
得票数 0
回答已采纳
1
回答
GPU
Dask
Cuda集群: client.submit
、
、
我非常熟悉为CPU分发的
Dask
。我想探索如何在GPU内核上
运行
我的代码。当我向LocalCUDACluster提交
任务
时
,我会得到以下错误:这是我的测试用例:如何正确分配CUDA核心上的
任务
?更新: 我第一次安装了
Dask
分布式
和
Dask
版本,成功
浏览 5
提问于2020-06-03
得票数 0
回答已采纳
1
回答
如何使用
dask
执行多
线程
的“`merge()”?如何通过qsub使用多重核?
、
、
、
、
我刚刚开始使用
dask
,我仍然对如何使用多个
线程
或使用集群来执行简单的熊猫
任务
感到困惑。
dask
.set_options(get=
dask
.threaded.get)这将使用
许多
线程
存在(也就是说,
在
您的笔记本上存在
浏览 4
提问于2016-10-14
得票数 6
回答已采纳
2
回答
强制重新计算因被杀死的
工作
进程而出错的
任务
由于某些集群规则,可能会发生由于给定原因(例如,
在
具有高优先级的节点中分配给另一组用户)而导致进程被终止的情况 有没有办法让worker中的
任务
或数据集获得“lost”标记,以便
Dask
/Distributed系统重新
运行
该特定
任务
以及它的依赖图?
浏览 3
提问于2017-02-03
得票数 1
1
回答
如何在
Dask
分布式
工作
人员之间共享一个大型只读对象?
、
、
、
、
问题 distributed.worker - WARNING - Memory use is high but worker has no data to也许还有其他的进程
在
漏掉
内存
?进
浏览 0
提问于2019-02-09
得票数 3
1
回答
Dask
延迟性能问题
、
、
我正在尝试并行化一个不使用
Dask
容器的“自定义”函数。我只想加快计算速度。但是我的结果是,当我尝试使用
dask
.delayed并行化时,它的性能要比
运行
串行版本差得多。下面是一个演示问题的最小实现(我实际上想要这样做的代码涉及得更多:) # CPU intensiveprint(f'time to run in serial {t}
浏览 1
提问于2022-09-25
得票数 2
2
回答
关于集群调度器和单机
分布式
调度器的混淆
、
在下面的代码中,为什么dd.read_csv
在
集群上
运行
?client.read_csv应该在集群上
运行
。import
dask
.dataframe as dddd.read_csv('file.csv',blocksize=10e7)是不是一旦我创建了一个客户端对象,所有的api调用都会在集群上
浏览 2
提问于2018-06-28
得票数 0
1
回答
在
fastAPI应用程序中通过python缓慢读取小zarr/S3数据
、
、
、
、
> PM10 (time) float32
dask
.array<chunksize=(24,), meta=np.ndarray> SO2 (t
浏览 10
提问于2022-10-13
得票数 0
1
回答
dask
是如何实现并行性的?
、
我不太理解达斯克的并行模型(https://docs.
dask
.org/en/latest/delayed-best-practices.html) 既然delayed是单
线程
的,那么python到底能提供什么性能优势呢
浏览 17
提问于2020-10-13
得票数 0
1
回答
用
dask
加载大型数据集
、
我们一直
在
探索如何利用
Dask
不仅提供计算,而且充当一个
分布式
缓存,以加快我们的
工作
流。我们
在
Dask
集群中加载和持久化比
内存
更大的数据集
时
遇到了一些问题。with --memory-limit=150e9.from
dask
.distributed我的问题是:使用
Dask
作为
分布式
缓存是否存在固
浏览 0
提问于2018-06-11
得票数 2
回答已采纳
1
回答
将使用大型np.ndarray的短
任务
并行化
、
、
import multiprocessing pool.map(f, M)因此,问题是如何使用
dask
处理以大数据为输入的短
任务
?
浏览 7
提问于2022-03-07
得票数 0
1
回答
dask
,如何取消计算?
、
、
e.g2)一般情况下,如何停止所有正在
运行
的
任务
? 这就是client.cancel(futures)。
dask
会存储它们的列表吗?
浏览 0
提问于2020-02-26
得票数 0
1
回答
写入xarray数据集要比读取它慢得多?
、
、
、
当我们编写用open_dataset打开的单个文件
时
,将这4秒与78 ms进行比较。顺便说一下,这里是每个文件的样子:
浏览 25
提问于2022-08-05
得票数 1
回答已采纳
1
回答
Dask
+ PostgreSQL read_sql_table:错误的数据类型index_col
、
、
我正在尝试对一个非常大的PostgreSQL表中的列
运行
mean()函数。因为我不能在
内存
中加载列,所以我选择了并行和
Dask
分布式
分区。系统配置: 12 cores / 24 threadsSSD 我已经尝试(1)
在
1个进程中最大化
线程
计数(24),(2)
在
每个进程中都尝试最大化
线程
计数(24)。问题是,无论哪种情况,from-delayed
任务
都需要24秒的>=时间。此
任务
主
浏览 26
提问于2019-08-28
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
尹立博:Python 全局解释器锁与并发
(新版)Python 分布式爬虫与 JS 逆向进阶实战-梦里有时终须有
(新版完结无密)Python 分布式爬虫与 JS 逆向进阶实战
使用 Dask在Python 中进行并行计算
Python太慢了吗?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券