AI如何无师自通闯关《超级马里奥兄弟》

目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习

记者/叶展旗 编辑/黄凯茜

AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

“飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

人工智能可以如何利用好奇心自我监督学习?这份好奇心如何驱动他们闯关马里奥?该如何定义人工智能的好奇心?好奇心对于AI从专才到通才的转变可以提供哪些思路?

.....

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180408A166UR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券