首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何提高训练机器人的效率?外媒:正强化法

【环球网科技综合报道】10月27日消息,据外媒报道,约翰斯·霍普金斯大学博士生安德鲁·洪特(Andrew Hundt) 近日发布一篇新论文,指出应通过正强化法训练机器人学习新技能。

这篇论文的核心思想是,在训练机器人的过程中,应采用正强化法,即相比于在它做错时进行惩罚,更应在它做对时进行激励。而对于机器人来说,这种激励机制是以评分系统的形式呈现的,类似玩游戏一样,根据执行任务的情况获得积分。

安德鲁表示,这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数,所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性,现在只用两天就能做到。”

不过他也指出,目前机器人执行的这些任务仍然是比较初级的,比如堆积木。但在未来,机器人有望通过正强化法完成更复杂和有意义的任务。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201027A09C7E00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券