首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >什么是 Multiagent Q Learning

什么是 Multiagent Q Learning

作者头像
杨熹
发布2020-04-09 11:59:42
8880
发布2020-04-09 11:59:42
举报
文章被收录于专栏:杨熹的专栏杨熹的专栏

multiagent 是指同时有多个 agent 更新 value 和 Q 函数,主要的算法有:q learning, friend and foe q leaning,correlated q learning,在每个训练步骤,学习器会考虑多个 agent 的联合 states,actions,reward,来更新 q 值,其中会用到函数 f 选择价值函数。

下图是单一 agent 和 多个 agent 的对比图,可以很直观地看到区别:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档