近日,基于 Project Malmo,微软发起了一项协作 AI 挑战赛:The Malmo Collaborative AI Challenge,目前已经开始注册报名。
微软在赛事介绍中表示:与人类协作是当前 AI 研究的一项长期目标,因为协作是最终开发出真正的类人 AI 的关键。当前诸多 AI 研究的热门领域,包括语音识别、机器翻译和图像抓取等,都可以视为类人 AI 的基础阶段。未来,真正的类人 AI 应该像人类身边一个真实的伙伴那样,理解人类的意图,和人类一起制定问题的解决方案,相互协作。虽然现阶段还不能实现这一目标,但诸如深度神经网络等新技术的发展却为我们指明了努力方向。
而这也正是微软发起此次大赛的初衷,即推动协作 AI(Collaborative AI)的进一步发展。
为了突出“协作”的主题,微软从欧洲经典协作理论 猎鹿博弈(Stag Hunt Model)中汲取了灵感。
编者注:猎鹿博弈源于欧洲启蒙思想家卢梭的著作《论人类不平等的起源和基础》中的一个故事。一个村庄有两个猎人,当地只有鹿和兔子两种猎物。如果猎人单兵作战,每人最多能打到 4 只兔子,够吃 4 天。而如果两人合作,则能打到1头鹿,可以供两人一起吃 10 天。显然,合作双赢是最好的选择。但现实情况是:如果一个猎人的能力强、贡献大,他就会要求得到较大的一份,这可能会让另一个猎人觉得利益受损而不愿意合作,这也是现实中很难达成合作的原因。
比赛要求每支参赛队伍(最多 3 名队员)开发并训练一个 AI 软件产品,然后通过这个软件产品参加一个名为 Pig Chase (小猪快跑)的小游戏。该游戏在 Minecraft 环境中展开,每局游戏有两名参赛者,一方为参赛队伍开发的 AI 软件产品,另一方为系统随机分配的队友,有可能是人类选手,也有可能是另一个队伍开发的 AI 软件。游戏一开始,参赛双方都有 25 分的原始积分,比赛要求双方在 25 步之内将一只小猪抓住,每走一步会减掉 1 分,最终抓住小猪双方各得 25 分,每轮比赛 10 局,最终累计得分高者获胜。
一个关键的规则是:选手并不一定要去抓那头小猪,也可以直接选择放弃:走到游戏环境中猪圈的出口位置,这样就能直接得到 5 分,结束比赛。所以问题的关键就在于:是选择相互协作,得到 25 分的高分,还是直接放弃,得到 5 分的低分。
目前,关于 Pig Chase 的样例代码和详细说明已经公开在 GitHub 上:
https://github.com/Microsoft/malmo-challenge/blob/master/ai_challenge/pig_chase/README.md
挑战赛已经于 3 月 14 日正式开始注册,参赛队伍需要在英国时间 4 月 14 日之前完成注册,并于 5 月 15 日之前完成作品提交。决赛通知会在 6 月 5 日发出。
除了在 GitHub 上提交软件源码之外,微软还要求每支参赛队伍提交一份说明文档,以及一个不超过 3 分钟的视频短片,用来对参赛的 AI 软件做一个概要的说明。
比赛的最终奖品需要在注册报名时预先选择,可选项一共两种,每支队伍可以选择其中之一或两个都选,最终的获奖情况要根据比赛成绩确定。
奖品1:微软研究院 AI 暑期培训机会。最终会评出三支获奖团队免费加入位于英国剑桥的微软暑期 AI 培训班。
奖品2:微软 Azure 研究资助奖。最终会评出三支获奖团队获得微软 Azure 提供的最高价值为 2 万美元的研究资助奖金。
比赛的评奖标准并非只看 Pig Chase 的游戏得分,微软公示的评奖标准包括如下 4 项:
● 软件算法是否原创,是否有创新性; ● Pig Chase 比赛的得分情况; ● 代码的编写质量; ● 项目在 GitHub 上的评分情况。
值得特别注意的是,微软要求本次大赛的参赛者最好是博士或硕士生,而且领队必须是博士,虽然本科生也可以参赛,但他们即便获胜也不能参加微软的暑期 AI 培训班。
另外,虽然微软允许所有国家的队伍参赛,但只有欧洲经济区国家(EEA)或瑞士的队员才能最终参加微软的暑期 AI 培训班。
这样看来,本科生或者其他国家的参赛者,或许只能选择那 2 万美元的研究资助奖金了。
赛事详情:https://www.microsoft.com/en-us/research/academic-program/collaborative-ai-challenge/