1950年涂林(AlanTuring)设计出一套想像实验,从此被视为人工智慧(AI)的终极测试。他称该实验为「模仿游戏」,但大部份人称为「涂林测试」。涂林预期电脑程式能假装成人类(像是现在的聊天机器人),回答关于诗歌的问题,或故意犯下计算错误,欺骗人类裁判误认它是人类。
问题是在涂林测试中太容易取巧了,只要蓄意欺骗或假装无知便能「获胜」。涂林在某种程度上也体认到,获胜的诀窍在于不要正面回答问题。如果裁判询问机器:「你有知觉吗?」机器必须说谎才能获胜。但这怪象不是例外,而是规则。换句话说,通过涂林测试的途径就是欺骗。
2014年,聊天机器人EugeneGoostman将成为一名来自乌克兰敖德萨的13岁男孩。他喜欢挖人,从不积极回答问题。据说已通过涂林试验。大约三分之一的裁判被欺骗,足以获得表面上的胜利。但那怎么样?裁判只与他谈了几分钟。如果有足够的时间,毫无疑问他们迟早会发现真相。事实上,古斯特曼所理解的知识几乎等于零。以计算机科学家ScottAaronson和机器人之间的对话为例:
原本的涂林测试显然无法在这么短的时间内得出结论。古斯特曼登上媒体后不久,我提出一套替代测试,希望找出不会一味回避问题的真正AI。在《纽约客》的部落格上,我提议放弃涂林测试,改用更健全的「理解挑战」,我称之为「21世纪的涂林测试」。我在部落格上描述测试的目标,是「创造一套电脑程式,在随意观看电视节目或YouTube影片后,能回答与内容相关的问题」,例如俄罗斯为何入侵克里米亚?
FrancescaRossi当时读了我的文章,并提议共同实施新的Tulin测试;她后来担任国际人工智能联合会主席。我们邀请卡内基梅隆大学的机器人科学家ManuelaVeloso和美国人工智能促进协会(AAAI)的前任主席进行头脑风暴。一开始,我们想找到一个可以取代涂林测试的单一测试,但我们很快就转向了这个想法:就像有不止一个测试来评估运动员的能力一样,我们还需要进行各种测试才能找到真正的AI。
领取专属 10元无门槛券
私享最新 技术干货