文章/答案/技术大牛

发布

社区首页 >问答首页 >GPU在演员评论家(A2C)稳定Baselines3实现中的应用不足

问GPU在演员评论家(A2C)稳定Baselines3实现中的应用不足
EN

Stack Overflow用户

提问于 2021-03-14 18:44:52

回答 1查看 2.5K关注 0票数 4

我正在尝试使用A2C of StablesBaselines3在我的自定义环境中训练代理。我的问题是，我的GPU利用率非常低(只有10 %左右)，而我的CPU利用率已经达到上限。正因为如此，训练非常缓慢。根据@araffin https://github.com/hill-a/stable-baselines/issues/308解决的这个讨论线程，我尝试了以下内容

将角色结构和批判性结构扩展为分别有256个、256个和128个神经元的三层神经网络。在此之后，GPU的利用率确实增加了，但它只是边际的(从10 %增加到15 %)，如在suggestion
changed device参数A2C方法中，从默认的“cuda”到“cuda”，即“auto”-无改进的

。

在上面提到的讨论中，还不完全清楚什么对用户有效。我的A2C被简化如下：

import gym
from stable_baselines3 import A2C
policy_kwargs = dict(activation_fn=th.nn.ReLU,
                     net_arch=[dict(pi=[256, 256, 128], vf=[256, 256, 128])])
model = A2C("MlpPolicy", env, verbose=1,  learning_rate=linear_schedule(0.001),\
 n_steps=50, gamma=0.8, gae_lambda=1.0, ent_coef=0.2, vf_coef=0.2, \
tensorboard_log=logdir,  policy_kwargs=policy_kwargs, seed=50, device='cuda' )
model.learn(total_timesteps=50000)

GPU配置如下：

Cuda版本- 9.0
GPU - NVIDIA RTX 2080 i
GPU mem-11gb(其中仅使用大约1600 mem )

CPU配置

versions

Torch -2

/ socket - 8

Intel i9核9900 K@ 3.6 Ghz

CPU Mem -32 on GPU - 2.4.1 (虽然我知道SB3实现在anaconda环境

F 233上使用Torch)

Python 3.7

任何帮助都将不胜感激！

gpu

reinforcement-learning

pytorch

回答 1

Stack Overflow用户

发布于 2022-02-10 14:32:25

稳定的基线使用你的gpu ..。如果您在第二个选项卡上查看任务管理器，单击gpu，选择cuda代替3D，您将看到cuda的使用情况。

我对我的env有一些麻烦，因为我的env使用熊猫。熊猫使用cpu ..。在windows上使用cudf是不容易的，所以我的cpu使用了100%。

我在我的习惯上用熊猫和矮胖..。为了改进它，我应该使用狡猾和cudf代替，但要做到这一点，我需要linux。

所以现在，我的cpu使用的是100%的gpu，使用的是cuda 70%，gpu内存几乎是1.7GB

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66628280

复制

相似问题

问GPU在演员评论家(A2C)稳定Baselines3实现中的应用不足
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问GPU在演员评论家(A2C)稳定Baselines3实现中的应用不足EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问GPU在演员评论家(A2C)稳定Baselines3实现中的应用不足
EN