微软首席语音科学家：人工智慧若不能解决语言问题，就是瞎忽悠

文章来源：企鹅号 - 数码小帅哥

让电脑从感知走到认知，微软首席语音科学家黄学东认为，最关键的一项指标就是对语言的理解。

1991年，微软创办人比尔．盖兹（Bill Gates）成立微软研究院的初衷，就是希望电脑有一天能会看、会讲话。

不过随着人工智慧（AI）发展至今，有「感知」能力的电脑已经不稀奇，让电脑学会「认知」才是科学家现在努力的目标。而要让电脑从感知走到认知，微软首席语音科学家黄学东认为，最关键的一项指标就是是否能理解语言。

AI感知大跃进，视觉、语音、文本理解能力超越人类

近年，微软研发的AI技术，在语音转文字、图像辨识、中英翻译、文本理解等四大领域，皆超越人类平均水准。而其中，有三项都出自黄学东所带领的语音及语言团队。

该团队让黄学东满是骄傲的最新一项技术突破，即是「AI语音合成」，透过深度神经网路语音合成技术，让电脑能模仿人类说话的语调、韵律和发音，取代以往硬梆梆的机械音；根据微软现场展示，让人类和电脑随机轮流说一段句子，一般人根本难以辨识出差异，实际测试，五题中仅答对两题，显示电脑语音合成的拟真度相当高。

「1982年我在清华做研究生的时候，很难想像计算机能听懂人的话、和人的水平一样，」黄学东说，「从1982年到2017年，这愿望已经实现了。」

黄学东观察，深度学习让电脑的感知能力大幅进步，像是语音处理、图像识别、机器翻译等，近几年错误率皆大幅降低，但他认为，距离可以举一反三、有「认知」能力的AI ，仍有不小距离。

AI从感知到认知，能否理解语言是关键

「语音和语言是人工智能进化的标杆，」黄学东指出，经过几万年演进，让人类不同于其他动物的关键，就是语言。

他举例，比感知，动物比人类还优异，像是狗的嗅觉、猫的视觉、猎豹的移动速度，都优于人类，但在语言部分，人类最突出。

「在人类进化中，语言起了最决定性的作用，」黄学东说，也因此他认为，「人工智能不解决语言问题，基本上是瞎忽悠。」

不过，让电脑能「理解内容」，得先让电脑学会推理关系、逻辑关系和知识获取等能力。「这都是我们的障碍，才刚刚起步，」他说，「这就是为什么我做了三十年还没解决的问题，还在做。」他的最终目标，是希望解决语言障碍，让电脑能理解人的语言，进而掌握、传承知识。

只不过到了那天，可以24小时吸收知识的电脑，是否都比人类聪明了？「那肯定是的。」黄学东毫不迟疑地说。不过他也乐观相信，人类的创造性最终能找到与机器共存的方法。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货