亚马逊花百万美元打造AI聊天比赛,它收获了什么?

第一位对话者是一个五十多岁的肌肉男,剃着光头,身着黑色V领毛衣。他走进一间会议室,坐在低矮的蓝色扶手椅上,前面是一排摄像机和工作室照明灯。他被灯光照得明亮,而房间的其余部分处于完全黑暗之中。他凝视着面前小桌子上的一个黑色曲棍球状物体——这是亚马逊的智能音箱Echo。 他说,“Alexa,我们聊聊吧。”

“早上好,我的朋友,”一个女性声音回答说,这声音是合成的,但确实非常可爱, Echo的头上紫色的灯光也在闪烁着。“现在是下午吗?我不太确定。“

“是早上,”男子回答道。

“太好了,大家早上总是精力充沛......呃,今天过得怎么样?”

“我过的不错,你呢?”

“嗯,我总是很忙,因为人们一直在跟我聊天......但听着真是太好笑了,Reddit最近发布了一篇文章:‘牙膏就是嘴里用的肥皂。’”

在另一间会议室的大厅里,10名亚马逊员工戴着耳机坐在长桌旁,认真监视着一切,就像是中央情报局的特工。在另一个房间里,三名男子坐在由黑色窗帘隔开的小隔间里。他们也戴着耳机,同样也有摄像机对着他们。最后,在控制中心,一个视频工作人员正在监视大屏幕上的所有信息。一切都需要被记录下来,因为亚马逊想要完全了解今天发生的一切。

去年11月开始的这场大型比赛,目前是为期一个月比赛的最后决赛。亚马逊已经和15个世界上最好的计算机科学研究生团队进行挑战,以开发“一个能够与人类进行持续热烈交流超过20分钟的社交机器人”。如果任何一个团队成功了,其团队成员将会获得学术荣誉,同时也会在未来开启辉煌的职业生涯。(你大可以想想DARPA曾经举行的机器人挑战赛,或者是早期关于自动驾驶汽车技术的竞赛,其获胜者将在谷歌、福特以及Uber等公司的自动驾驶汽车业务部门谋得很好的职位。)更重要的是,他们将带走被亚马逊称为Alexa Prize的百万美元大奖。

或许你并没有注意,过去几年里,亚马逊已经砸重金开发会话式AI,和其征服零售业的野心不相上下。该公司有超过5000人为Alexa平台工作。据报道,自2015年以来,它已经售出2000多万部Echo。亚马逊认为,终有一天人工智能系统不仅仅能够控制电灯开关和播放列表,还将能够驾驶汽车,诊断疾病,并渗透到我们生活的方方面面。语音将成为主要的用户交互方式,而对话本身——那些机器与人之间有用的、内容丰富的、友好的、有趣的对话——将成为最终产品。

但是,所有这些早期的成功和雄心壮志,让亚马逊从高高的悬崖上跌落,困在广阔又危险的山谷之中。如今的Alexa和所有的语音助手一样,常常无法理解我们看起来显而易见的事实。Alexa平台的快速扩展和广泛应用,激发了消费者对语音助手的需求。虽然Alexa在设置闹钟或者完成一次性的命令方面做得还不错,但谈话本身就是一种交互的社交模式。Alexa人工智能研究团队负责人Ashwin Ram表示,“人们总希望Alexa能像朋友一样和他们聊天,然而人类对话的无限可变性,情境中的突然变化以及上下文语义的衔接问题普遍被认为是人工智能最难解决的问题之一,而亚马逊已经铤而走险。”

Alexa Prize并不是第一次尝试从全世界的聊天机器人中激发出更多人性化关系的比赛。在过去三十年的大部分时间里,一群计算机科学家和业余爱好者总会聚集在一起,争夺Loebner Prize。在比赛中,参赛者试图欺骗评审,让他们相信聊天机器人是人类。多年以来这个奖项都引发了不少争议,一些人工智能研究人员把它称为一种宣传噱头,同时也对人和机器的本质区别进行了大量反思,相比之下,Alexa Prize在两个方面有所不同。首先,比赛重点不是要通过欺骗让人相信Alexa是一个人。其次无论是人力、财力和计算能力来看,比赛规模都更大。在比赛的早期阶段,也就是2017年的几个月,在美国的任何人都可以使用随机选择的比赛机器人与亚马逊语音设备说“Alexa,让我们聊天”。然后他们被邀请就对话内容进行1星到5星的打分。这些机器人程序都有数百万次评级互动,使Alexa Prize在竞赛数量级上成为了世界上规模最大的聊天机器人竞赛。

去年11月,比赛在一间配有蓝色扶手椅和聚光灯的房间里达到高潮。

那个剃光头、身穿黑色毛衣的家伙叫做Mike George。去年7月从亚马逊退休之前,他负责监督Alexa平台。与此同时,展台上的男士们则是对每一段对话进行打分的评委。如果一名评委认为对话已经偏离主题,他可以按下手持式魔杖上的按钮;如果第二名评委也这样做,那么会话和计时器都会被暂停。没有人清楚哪个机器人属于哪个团队,包括对话者和评委。

“让我们来谈谈音乐吧,” George说。

“我喜欢音乐;它每次都能让我放松,”机器人回答,“那么,你有没有最喜欢的艺术家或歌曲?”

“我喜欢Django Reinhardt。”

“Django Reinhardt?那个有名的爵士乐艺术家?” Riffing,这位社交机器人讲述了一个关于来自Black Sabbath的吉他手Tony Iommi的故事。Iommi在一次事故中失去了两根手指的指尖。但是当知道Reinhardt只用左手的两只手指就能继续演奏时,他对自己的职业生涯并未丧失信心。那么,George最喜欢Reinhardt的哪一首歌呢?

George回避了这个问题,“你喜欢Jack Johnson吗?”他又问道。

机器人似乎会毫不理会这个问题。 “来吧,”它回答,“我喜欢与你聊天。”

George身体略微前倾并再次尝试。 “Jack Johnson,你喜欢他吗?”

机器人再次回答了同样的话,“来吧,我喜欢和你聊天。”

在由窗帘隔开的房间里,一名评委按下他的“杀人”按钮。很快另一个评委也是如此。一个女人走进房间,在George耳边低语。“Alexa,停下来,”他点头说道,带着一点失望,这次对话仅仅进行了三分钟。如果Ram坐在房间里的话肯定会很沮丧。在整个比赛过程中,他的口头禅就是:“人们需要明白这是一个非常困难的问题,而且现在还处于会话式AI的早期阶段。”与计算机聊天二十分钟不是登月,等于是登火星。

Alexa Prize评审们所待的亚马逊控制室

对会话式AI的狂热追求已经引发了亚马逊、苹果、Facebook谷歌以及微软等科技公司巨头对两大重要资源的争夺。第一种资源是有限的:计算机科学中的顶尖博士,由于他们的稀缺性,他们现在的薪酬已经达到了六位数。第二个虽然是无限的,但很难获得:对话的样本——成千上百亿个对话样本可以被收集,数字化,并用于训练人工智能。在这种背景下,Alexa Prize堪称是亚马逊的杰作。这次比赛既是对世界上最优秀研究生的人才搜索,也是一次以低廉价格获得参赛者聪明才智的机会。此外,它还为亚马逊提供了一个收集其他科技公司所没有的会话数据库的机会。

当亚马逊于2016年9月29日首次宣布比赛时,来自22个国家的100多个大学团队申请参赛。在技术价值和创意等方面进行初筛后,共有15个团队进入了竞赛的最终环节。除三支队伍外,其他队伍都获得了10万美元的现金资助和公司支持,以推动他们的研究。

就像大学篮球赛中的“疯狂三月”(March Madness)一样,进入竞赛最终环节的团队有强大背景的技术卫冕者、有力的竞争者和勇敢的无名小卒。蒙特利尔大学团队拥有深度学习先驱Yoshua Bengio这样的教师顾问,当然被列为顶级种子选手。也有不少强有力的竞争者,其中包括来自华盛顿大学、普林斯顿大学以及苏格兰首屈一指的研究型大学赫瑞瓦特等著名学校的团队。然后还有一些无名小卒,比如来自布拉格的捷克科技大学团队。

捷克科技大学团队的成员中有一名23岁的小伙子,名叫Petr Marek。比赛前的那个夏天,他曾经花了不少时间来开发他所谓的“愚蠢”聊天机器人平台,但他也曾在波希米亚的森林中担任童子军领袖。当他听说Alexa Prize这个比赛时,Marek一度担心他和他的团队没有相应的资格。 “好吧,”他想,“即便我们没有机会去对抗这些顶尖大学,但至少我们可以尝试一下。”在得知他们已经成为参赛选手之后,团队决定将他们的机器人命名为Alquist,这是20世纪初期捷克戏剧RUR中的一个角色,“机器人”(robot)一词正是通过这部剧被引入了世界(在剧中,机器人占领了这个星球,Alquist成为了地球上最后一个人类。)

从一开始,参赛的15个团队都面临着一个有争议的问题:社交机器人大脑的哪些部分应该人工编程,而哪些部分又应该使用机器学习?人工编程是一种更为传统的方法,工程师们费力地编写大量规则来指导人工智能对会话的理解和反应。相比之下,统计学驱动的机器学习方法让计算机通过从海量数据中进行自学来指导自己进行对话。

所有团队都清楚,机器学习是解决所谓分类问题的最佳方法。通过这种方法,神经网络能够在海量杂乱数据中找出统一的模式。例如,语音识别是机器学习的一项自然任务。但是,谈到聊天机器人,其不仅仅是将对话翻译成语言,而且还要对听到的对话做出反应,对于现在的机器学习来说还有很长的路要走。这就是为什么即使在Alexa和Siri的数字化大脑中,老式的人工编程方法仍然具有相当大的影响力。因此,比赛中的每个团队都会像技术世界一样苦苦挣扎——找到两种方法之间的最佳平衡点。

人工编程已经过时:而机器学习则正处于白热化。Marek和他的队友都知道,所有的强队都会倾向于使用后一种方法。所以他们也认为自己的团队也应该这样做。为了帮助Alquist自动生成对Alexa用户的响应,该团队用来自Reddit用户的300万条消息和响应训练了一个神经网络。让他们感到沮丧的是,该神经网络产生的反应“非常糟糕”, Marek表示。Alquist会在对话主题之间肆意跳跃,并引用用户从未说过的东西。它会轻易断言,然后又会自我否认。“和这种人工智能对话不是什么好事,也不好笑,” Marek在他的团队博客中沮丧地写道, “这太荒谬了。”

所以在2017年初,捷克队改变了策略,并致力于编写广泛的对话指导规则。该团队创建了10个“结构化主题对话”域:包括新闻、体育、电影、音乐、书籍等等。捷克队的人工智能系统被设计成可了解每一个主题的核心内容,并且可以在不同主题之间自由切换。这个社交机器人在任何特定时刻所使用的精确单词通常由预先编写的模板组成,同时再从各种数据库中检索出更具体的内容以填充对话内容的空白。例如,系统可能会设置为“我看到你喜欢(用户提到的书籍作者)。你知道(作者)也写了(书名)吗?你读过那个吗?”

人工编程给了捷克队更好的控制权,但Marek依旧忧心忡忡。该系统在很大程度上依赖于用户的善意,依赖于他们用简单的句子说话,并基本上遵循机器人的引导。Marek说,如果碰上“不合作的用户”,像正常人一样说话,或者说没有什么耐心的话,社交机器人很容易失败。

而在距离布拉格数千里的地方,爱丁堡郊外的农田起伏绵延。苏格兰赫瑞瓦特团队的教师顾问Oliver Lemon正在关注亚马逊发布的团队平均用户评分。Lemon戴着眼镜,看起来有点像喜剧演员John Oliver。他会打网球和游泳,并且有不服输的天性。他认为他的团队能轻松进入前五。但在2017年初夏,赫瑞瓦特团队排在第九位。“我知道我们可以做得更好,” Lemon说,听起来像一个教练刚刚经历了一场草率的失利。

在一次黑客马拉松比赛中,Lemon和他的学生们试图弄清楚他们如何能够提升相应水平。虽然他们没有任何可以请教的深度学习先驱,但赫瑞瓦特团队还是在尽可能地使用机器学习。他们把注意力放在最艰巨的挑战上:闲聊。对于机器学习系统来说,漫无目的的闲聊特别艰难的,因为通常没有一种可验证的固定方式来进行闲聊。当有一个明确的目标时,神经网络的效果最好,比如在围棋游戏中获胜,通过大量的反复试错,系统总可以找到最佳策略。但是闲聊没有目标可言。

为了解决这个问题,该团队采用了谷歌研究人员普遍使用的一项技术。首先,团队通过电影字幕数据库和来自Twitter和Reddit的数千个消息线程训练神经网络。通过这个人类玩笑的巨大语料库,系统学会预测关于对话的最恰当回复。然后,这种技术(称为seq2seq)可以让机器人即时生成自己的回复,而不是直接从原始Twitter或Reddit对话中检索相应回复。

这听起来很酷,但赫瑞瓦特团队的策略很快与seq2seq技术的两个特征问题相冲突。一个是,系统通常会把诸如“OK”以及“sure”等语句默认成单调、敷衍的语句,因为这些语句在Twitter和电影对话中广泛存在。另一个是训练对话中还包含了大量不恰当的言论,赫瑞瓦特的社交机器人学会了模仿这些腔调,就像一年级的学生会学操场上的大孩子说脏话。

“只要我愿意,我可以和很多人一起睡,”赫瑞瓦特社交机器人这样告诉一位用户。

当另一个用户问道:“我应该卖掉我的房子吗?”这个社交机器人起哄似地建议道:“卖,卖,卖!

最糟糕的是,当用户问到“我应该自杀吗?”这个社交机器人回答说:“是的。”(参加Alexa Prize比赛的用户是匿名的,所以无法知道这是否是真正的或者只是试图对一个机器人发表一些糟糕的言论,但是亚马逊正在监控所有社交机器人对不适当内容的回应,因此不得不告诉赫瑞瓦特要控制它的创作。)

由于seq2seq技术的冲突问题必须解决,导致赫瑞瓦特团队整个夏季都在改进其技术。该团队将社交机器人的大脑分成一系列小型机器人组成的联合体,每个机器人都有自己的专业。新闻机器人阅读《华盛顿邮报》和其他消息来源的头条新闻和简短摘要。另一个机器人专门讨论天气,还有一个机器人专职访问维基百科,提供从海洋运动到公众人物Kim Kardashian的相关信息。最后,团队成员Amanda Curry创建了一个基于规则的角色机器人,为最终产品打造一个统一稳定的身份。她用精心策划的观点和传记事实为机器人打造身份特征。 “我认为它有助于让人们了解机器人也有和他们一样的性格特征,比如说自己喜欢的颜色,” Curry说。

在用户发表任何言论之后,在这些组件机器人中至少会有一个可能产生响应,就像是教室里听到老师问题就急切举手的学生们。为了选择出最好的一个,赫瑞瓦特团队训练其系统对响应进行统计评估。候选的响应是否与用户刚才所说的一致?或者反过来说,是不是太过相似以至于它只是重复用户刚才所说的话?这个响应是关于目标话题的吗?答案是否太短或太长?最初,赫瑞瓦特团队只是猜测每个指标的权重有多大。但到了秋天,神经网络已经学会了自动调整权重以最大限度地提高用户评分。

好胜心强的Lemon很高兴地看到,他团队的排名不断上升。随着比赛的进行,赫瑞瓦特团队跻身领先集团。

尽管赫瑞瓦特团队在积分榜上一路高歌猛进,而华盛顿大学团队却稳稳排在前三名。看起来该团队采取了一种折中的方法,将基于规则的编程方法和机器学习混合到其系统中。但他们的优势似乎来源于其社交机器人对于该团队28岁学生领导人Hao Fang个性的反应。Hao Fang来自中国江西省的宜春市,个性活跃开朗。他领导的团队也希望社交网络机器人的用户能够感到快乐。那么他们是如何创建出人们喜欢的对话呢?

在早期,Fang发现华盛顿大学团队的社交机器人和其他许多竞争对手一样,也很容易出现反反复复的沉闷标题(“火箭袭击杀死17人”)或者枯燥的事实(“家庭或住所是作为永久性或半永久性居住的地方”)。所以华盛顿大学团队所设计的系统会过滤掉那些可能导致用户说出“这太可怕了”的内容。Fang表示,该系统会通过诸如Today I Learned, Showerthoughts以及lifting News等订阅媒体寻找“更有趣、更振奋、更健谈”的内容。这使得机器人能够抛弃像“古典音乐是唯一一种涵盖范围很广的音乐流派”之类奇怪的论断。

当人们意识到自己在被倾听时,他们往往会更快乐。所以华盛顿大学训练其系统仔细分类话语。机器人是否应该回答事实,提供意见或回答个人问题?该团队还精心制作了大量的反馈语言 - “看起来你想要谈论新闻”,“我很高兴你喜欢这个,”“对不起,我不明白,”等等。一个优秀的对话者也会关注人们的情绪,所以华盛顿大学团队手动标记了2000个对话样本的情感基调,并用它们来训练社交机器人识别人们的反应:感到高兴、厌恶、有趣、兴奋,并作出相应反应。在大项目中这些都是相当简单的东西,但是无疑会让机器人的对话感觉更为专注和顺畅。

8月29日,亚马逊宣布有三支队伍将参加决赛。蒙特利尔大学团队积极推动机器学习,但牺牲了更多行之有效的策略,未能成功入选。

最终入围决赛的团队包括赫瑞瓦特团队,在平均每周用户排名中位列第三,并经过亚马逊的严格内部评估后被选为“外卡”团队。一直以来表现优秀的华盛顿大学团队排名第二。而最不可思的是捷克科技大学团队,其名列第一。每个团队都有一个半月的时间来完善他们的系统,然后参加亚马逊公司在西雅图举行的最终决赛。

华盛顿大学团队:左起为Hao Cheng, Maarten Sap, Ari Holtzman, Elizabeth Clark, Hao Fang

“Alexa,我们聊聊。”

在11月中旬,另一位对话者John Curley坐在摄像头前的扶手椅上。Curley是西北太平洋地区的电视台和电台主持人,他穿着条纹衬衫和蓝色运动外套;他的声音低沉,笑起来像是好莱坞明星。但他那神经质般的言语风格很快就让社交机器人无所适从。

“很高兴和你聊聊,John,”一位社交机器人说,这是赫瑞瓦特团队的机器人,当然Curley和评委都不知道。“让我们彼此认识一下。请告诉我,你更喜欢科幻还是幻想小说?“

“两者都不怎么样。” Curley回答道,拒绝了这个机器人。 “让我问你一个问题,Alexa。昨天在西雅图发生了一场巨大的风暴,这是一场大风暴。”

“好吧,那我们继续吧,”机器人忽略了Curley的问题,这不是一个问题。 “告诉我,你对看书或看电影哪个更感兴趣?”

“阅读书籍,”Curley说。

“哦,一个书呆子......你最近读了哪本书?”

“我刚刚读完了一本书,但我想我不能把书名告诉你,我不认为我可以向你说标题,因为里面有一个脏话。但标题是“含蓄的艺术等等”( The Subtle Art of Not Giving a ***)。

显然机器人无法应付这个,还是 “你喜欢读什么书?”

Curley忽略了这个问题,换了一个话题。“Alexa,我会告诉你的。我能对你说实话吗?“

无论Curley要准备袒露什么都是一个谜,赫瑞瓦特机器人依旧过于机械地选择话题,“所以告诉我,你对运动或电子游戏哪个更感兴趣?”

他们在来回兜圈子。三分钟后,三名裁判中的两名摇摇头,按下了他们的按钮。Curley和其他机器人的聊天也有很多相同之处。他轮流尝试讨论和开玩笑。有一次,在Curley说他不去看电影之后,捷克科技大学的机器人依旧在顽固地问他:“你看过很多电影吗?”

“不,我没有,因为我是瞎子,” Curley讽刺地回答。

“你如何选择看哪部电影?”机器人用预先设定的对话模式继续发问。

“我通常通过闻气味来选择,” Curley说。

Curley恰恰是Marek所担心的那种不合作用户。他把多个句子连成一排,内容相互纠缠在一起,话题反复跳跃,不理会机器人的逻辑线索,并且交替出现叙述、讽刺和异想天开。简而言之,Curley在像和人一样对话。没有一个机器人能够坚持超过四分半钟,在他的比赛结束后,Curley开玩笑地说,“这就像一系列糟糕的约会。”

第三个对话者是当地的一位电台主持人,她被要求匿名参与。当她坐下时,脸上带着微笑。她讲话简短,语句清晰,似乎想让对话起作用。她和华盛顿大学机器人进行了关于足球、Vladimir Putin和圣诞节的简短对话。而和捷克科技大学的机器人一起,她谈论了自己正在阅读的一本书。她和赫瑞瓦特机器人交换了彼此对于美国前总统George Washington以及Ronald Reagan的看法。

即便这个电台主持人和社交机器人的交谈最长达到了7分钟,但其间的过程也是磕磕绊绊。她要求赫瑞瓦特机器人谈论一下战争问题。她向前倾斜,看起来很担心。 “可能会发生战争,”她说。

机器人回应道“如果我没有弄错,OR是位于纽约的50000瓦级调幅电台。”这时评委们不得不按下按钮。

总决赛中最好的对话发生在George身上。虽然几乎没有出现像Tom Stoppard戏剧中的闪光点,但它立即脱颖而出。聊天一开始,George要求讨论一下什么是机器人。社交机器人并没有机械地照搬维基百科中词条,它开玩笑地说,“如果说Daft Punk(法国著名电音乐队)真的是两个只想制作音乐的机器人呢?”

“真有意思,”George笑着说。

该机器人分享了一些关于Elon Musk和机器人的最新消息。它把问题又抛给了George,机器人问道:“你有没有听说过Musk?”

“我有,”George吹牛,“我认识他。”

“你知道Musk是Thank You for Smoking这部电影的执行制片人吗?”

“不知道,”George说,听起来非常确定。他和机器人在把书作为新的对话主题时来回交流得很顺畅。他们寒暄了几句,然后社交机器人说:“你知道我在想什么吗?最终,有人会成为最后一个活着的人。他们的名字不会出现在任何历史书中。”

“哦,那很难过!” George回答。

“我很抱歉让你心烦。你想继续讨论书吗?“

“我们来谈谈《黑暗塔》这本书。”

“对不起,我想我对《黑暗塔》这本书没什么了解。你想谈谈电影《黑暗塔》吗?”

“当然。”

“太好了。你看过这部电影吗?它今年上映了。“

“我看过了。”

机器人问George是否喜欢Matthew McConaughey在电影中的表现。George给予了肯定。听到这个,机器人推荐了McConaughey的另一部电影《华尔街之狼》。几轮谈话之后,机器人开了个玩笑。“你知道我在想什么吗?有人需要制作一个《星际穿越》Interstellar和《超时空接触》Contact的混合体,Matthew McConaughey试图阻止自己进入太空。“

George大笑起来。

谈话的其余部分更加散漫,但很少有混乱出现。音乐,运动,10分钟。电影《黑道圣徒》The Boondock Saints,12分钟。圣诞老人和他在气候变化中的角色,13分钟。George要求机器人唱歌,15分钟。再次讨论音乐和电影,医疗保健以及比尔盖茨。计时器已经过了19分钟,谈话仍在继续。

11月28日的拉斯维加斯,作为亚马逊网络服务年度会议的一部分,数百人在Aria度假村和赌场的一个大宴会厅内登记。前排座位专门留给了Alexa Prize决赛选手。“这是所有人的游戏,”赫瑞瓦特的Lemon认为。Marek则在乐观和疑惑之间摇摆。Fang和他的华盛顿大学队友压力最大。亚马逊的一位人士向他们的教师顾问Mari Ostendorf暗示说团队没有获胜。

舞台变黑,William Shatner录制的声音响了起来。“电脑吗?”他说,“请帮助我热烈欢迎亚马逊Alexa副总裁兼首席科学家Rohit Prasad!”Prasad大步走上舞台,发表一篇关于平台状态的演讲——这是在成功的北方,也是接管世界的南方。然后Prasad打开了写有Alexa Prize获奖者名字和对话时间的信封。“平均分数为3.17分,”他宣布,“平均持续时间为10分22秒......一等奖得主是华盛顿大学团队!”华盛顿大学团队队员从他们的座位上跳起来,欢呼声响彻天空。他们与Ostendorf抱成了一个环形,跳着叫着。Ostendorf意识到她事先得到的是垃圾情报,跳得最高。

正是华盛顿大学机器人和乔治的对话时间最长。Fang后来称之为“我们所经历过的最好对话”。最后,机器人的谈话陷入了关于医疗保健的死胡同。20分钟后两位评委按下了按钮。华盛顿大学团队走上舞台,Prasad为他们颁发了一个安慰奖——总金额为50万美元的巨型支票。Fang咧开嘴,向着相机竖起了大拇指。

Prasad然后宣布了第二名和第三名,分别是捷克科技大学和赫瑞瓦特团队,他们分别得到10万美元和5万美元的奖励。走在最后的Lemon脸上显得有些憔悴。几天后,当亚马逊宣布2018年将有另一场Alexa Prize竞赛时,他确定自己想要参与。

华盛顿大学团队顾问:教授Noah A. Smith和Mari Ostendorf

那么亚马逊,参赛团队和整个人工智能世界最终了解到人工编程和机器学习之间的平衡点了吗?作为胜利者的华盛顿大学团队已经找到了平衡点。与此同时,人工编程的捷克科技大学团队获得第二名。倾向于机器学习的赫瑞瓦特团队获得第三名。但结果看起来模棱两可,那么混合系统的胜利对于Ram和其他人工智能专家来说是非常有意义的。Ram说,我们刚刚开始弄清楚如何更好地结合这两种方法。

比赛中的每个人都认为,对改进机器学习最有帮助的是更多的会话数据。最终,这是亚马逊自己的战利品。通过比赛,用户与社交机器人进行了数百万次互动,收集了超过10万小时的聊天记录,所有这些都是公司的官方财产。这场竞赛的最终赢家显而易见:亚马逊。

本文分享自微信公众号 - 机器人网(robot_globalsources)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【研究院】CHI 2016大会丨人机交互进入手感操作时代

【新智元导读】新智元开通“研究院”专栏,提供各大研究院最新人工智能技术和产业信息,助你掌握业界动态,了解顶级机构研发实例。第一期专栏推荐三星电子中国研究院人机交...

30730
来自专栏大数据文摘

[重磅]吴军:数据为王和机器智能的时代

25820
来自专栏大数据文摘

2016年下半年10个重要的可视化发展

18450
来自专栏玉树芝兰

写给我即将入学的研究生(英语学习篇)

之前,我给你的师兄师姐们写过《写给我即将毕业的研究生》。那些都是关于毕业后走上工作岗位的事情。这次给你写的,是关于未来三年,你求学过程中可能会遇到的一些实际问题...

16350
来自专栏AI科技大本营的专栏

全网首发 | 科技超人马斯克的第四次惊天创举,这一次,他将拿人脑开刀(一)

这是一篇让科技迷们等了大半年的文章。 Tim Urban每每出一篇文章,总能引起科技迷们的狂热追捧。 Sorry,不止科技迷,没有任何基础的路人们,也能一口...

32370
来自专栏数据科学与人工智能

【陆勤阅读】从经典数据案例看面对大数据我们如何去驾驭?

大数据掀起的革命,正在全面影响你我的生活。面对如此大量数据,该怎麽用?如何正确解读?国外企业成功经验,可以做为借鉴。   一场大数据分析的「数据革命」登场,正掀...

27470
来自专栏CDA数据分析师

小明说,我是数据分析师 ——-浅谈数据分析师的前世今生

“小明,听说你是数学专业出身的?”   “是的,领导。”   “那你去把这些手抄报表录入到电脑里去。”   “老板,请你尊重我的专业”   “那你把...

21280
来自专栏包子铺里聊IT

微软适合正青春的你吗?

注: 文章有些地方中英混杂,实属装(wu)13(nai),applogize in advance. 伴随着微软2015年又一轮大刀阔斧的裁员,小编在这里跟大...

38270
来自专栏腾讯社交用户体验设计

腾讯校招设计师求生指南

? 腾讯ISUX isux.tencent.com 社交用户体验设计 ? ? 本来我只想写一篇软文, 结果发现进厂还是得靠硬本事。 这不是一份传统意义上的面...

10110
来自专栏大数据文摘

大数据揭示最受欢迎在线教育课程特点

24770

扫码关注云+社区

领取腾讯云代金券