首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

IJCAI 2019 | 有趣!这是一篇玩倩女幽魂的多智能体强化学习研究

混合动作空间:与离散动作空间或连续动作空间不同,拥有混合动作空间的智能体在每一步执行动作时都需要选择一个离散动作以及该离散动作对应的一个或多个连续性动作参数的值。带有此类动作空间的问题在现实中广泛存在。比如在实际应用场景机器人足球世界杯中,一个足球机器人可以选择带球(离散)到某个位置(连续坐标)或者用力(连续)将球踢(离散)到某个位置等混合动作;在一些大型游戏中,玩家控制的每个角色在选择释放哪个技能(离散)后还需选择技能释放的位置(连续坐标)。传统的深度强化学习方法大多只能支持解决仅拥有离散或连续动作空间的问题,如 Qmix [Rashid et al., 2018],MADDPG[Lowe et al., 2017]。

03

CVPR2020 | 细胞图像分割的反馈U-net方法

今天给大家介绍的是日本名城大学Kazuhiro Hotta课题组在CVPR Workshop上发表了一篇名为“Feedback U-net for Cell Image Segmentation”的文章。受人脑神经元反馈的启发,文章中提出了用于细胞图像分割的一种新方法反馈U-net,由于其使用了LSTM卷积,提取的特征是基于保持特征的提取使得特征表示优于标准卷积并得到更多有用的特征,并且在U-Net第一轮的分割结果应用于第二轮,就可以对两轮的损失构建总损失函数来训练模型。将反馈U-net应用于果蝇和小鼠细胞,展示了其分割细胞图像的能力。文章用消融实验说明了反馈U-net中应用卷积LSTM保持的局部特征优于全局特征。此外,文章指出更好的卷积LSTM布局模式可能取得更好的结构。

01
领券