前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Science:AI 相互协作首次战胜人类,机器学习算法学会了“忠诚”

Science:AI 相互协作首次战胜人类,机器学习算法学会了“忠诚”

作者头像
新智元
发布2018-03-27 15:58:54
5510
发布2018-03-27 15:58:54
举报
文章被收录于专栏:新智元新智元

【新智元导读】人工智能在象棋、围棋甚至扑克等“零和”博弈中都已经超越人类,但迄今对机器相互“合作”以取得所有人利益最大化的研究不多。杨百翰大学的这项研究发现 S# 算法能够学会100%合作,有助于自动驾驶、无人机、自动化武器等的研究。

计算机第一次教会它们自己如何在游戏中进行合作,其目的是让所有玩家都能得到最好的结果。研究人员说,这项突破远比训练人工智能在诸如国际象棋或围棋之类双方要么输要么赢的比赛中取胜更加困难。这些进展有助于进一步增进人机合作。

20年前,超级计算机“深蓝”在国际象棋比赛中赢了当时的世界冠军 Garry Kasparov。最近,AI 研究者已经开发出在对计算要求更高的游戏(如围棋和扑克)中击败人类的程序。但是,这些都是赢者通吃,或者说“零和”(zero-sum)的游戏,也就是说,其中一个玩家赢了的话,其余玩家全输。研究人员在合作游戏方面的研究较少,这些研究的目的是让游戏玩家共同合作,以优化每个参与者的结果,即使从逻辑上来说每个玩家都可以通过“背叛”其他玩家以使自己的结果更好。

这类型的游戏包括“胆小鬼博弈”(The game of chicken),其中两名车手相对驱车而行,最先转弯的一方被耻笑为“胆小鬼”(chicken),让另一方胜出。还有博弈论中经典的“囚徒困境”,其中两个人因同一件罪行被指控有罪。假如两人彼此合作,都否认犯罪,双方都可缩短刑期(比如说1年)。但假如一个囚犯背叛了同伙,他可为自己带来利益(无罪开释),但同伙会被判更长的刑期(比如说3年)。假如双方都出卖对方,两人分别被判2年。“囚徒困境”只有一轮的话,从逻辑来说两名玩家都会出卖对方。但在重复的囚徒困境中,博弈反复进行,人们会学习合作,以获得最轻的刑期(1年)。

Jacob Crandall 是杨百翰大学计算机科学家,他和同事们想看看机器是否能够学习玩这类“非零和博弈”的游戏。研究人员让人类玩家和计算机一起玩电子版的“胆小鬼博弈”和“囚徒困境”,以及另外一个名为“Alternator”(霹雳赛车)的合作策略游戏,团队由两名人类玩家,两台计算机组成,或者一名人类玩家对一台计算机。研究人员测试了25种不同的机器学习算法,AI 程序可以通过在他们的行动和结果之间自动搜索相关性来提高表现。

让研究人员失望的是,这些算法都没有能够学会合作。但随后,他们转向从进化生物学获得的启发。他们认为,为什么不引入人类之所以能够合作的关键要素——沟通的能力呢?所以它们加入了19个预先写好的句子,比如“我正在改变我的策略”,“我接受你的最后一个建议”,或者“你出卖了我”,这些句子可以在每个回合之后在玩家之间来回传递。随着时间的推移,计算机必须使用它们的学习算法在游戏的语境中学习这些短语的含义。

这一次,被称为S#(发音是 S sharp)的算法在25种算法中凸显出来。当给出一个以前未知的游戏的描述时,该算法能学会在几轮之内与伙伴合作。而在游戏结束时,只有机器的队伍几乎100%的时间都是合作的,而人类队伍平均只有60%的时间合作。Crandall 说:“机器学习算法学会了忠诚。”

这种可靠性对于那些为自动驾驶汽车,无人机,甚至战场上的武器作决策的算法来说可能是福音。KTH 皇家理工学院机器人学家 Danica Kragic 说:“[迄今为止]像这样的合作都没有成为研究者的目标。”相反,她补充说,大多数研究工作都侧重于创造可以超越人类能力的自主技术,从人脸识别到玩扑克的程序都是这样。“机器需要学会做的不仅仅是竞争,”Crandall 补充说,“机器人技术的研究在强调合作方面做得更好,这可以作为 AI 继续进展的一种模式。”

3月27日,新智元开源·生态AI技术峰会暨新智元2017创业大赛颁奖盛典隆重召开,包括“BAT”在内的中国主流 AI 公司、600多名行业精英齐聚,共同为2017中国人工智能的发展画上了浓墨重彩的一笔。

访问以下链接,回顾大会盛况:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-03-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档