首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

(十一)模仿学习

解决这种情况的方法就是模仿学习 模仿学习(imitation learning),有时也叫示范学习或者学徒学习。指有一些专家的示范,通过模仿这些专家来达到目的。...模仿学习中主要有两个方法:行为克隆和逆强化学习   1.行为克隆   其实行为克隆和监督学习一样的。它的思路就是完全复制专家的行为(克隆),专家怎么干它就怎么干。   ...所以行为克隆并不能完全解决模仿学习的事情,就需要下面的方法   2.逆强化学习   之前介绍过需要模仿学习的原因就是因为获得不了奖励。而常规RL是从奖励函数出发去推导动作。...逆强化学习的框架如下:   还有一种第三人称视角模仿学习,在这里简单提一下。之前介绍的都是第一人称,机器人是参与主体。我们希望它在旁边看人类做就能自己学会做,这对它来说是第三人称。...把第三人称变成第一人称然后再学习的技术就叫做第三人称视角模仿学习。它的框架图如下:   模仿学习over!   课后题如下: 因作者水平有限,如有错误之处,请在下方评论区指正,谢谢!

43310

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券