微软全球执行副总裁沈向洋:7 点总结 20 多年的 AI 从业经验

AI 科技评论按:人工智能发展到今天已有 60 年的历史,成果累累,当然也遗留了 60 多年没有解决的问题。那么到底哪个问题 60 年都没解决,而且会继续延续下去,其中被人提及最多的就是如何赋予 AI 情商

在 AI 研究方面,微软有着 25 年的积累。环顾全球所有科技寡头,鲜有可与微软 AI 匹敌的公司。近日,微软全球执行副总裁、微软人工智能负责人沈向洋在北京的“未来论坛”中发表了《有情商的人工智能,让世界更美好》的演讲,深入讲述了自己多年的 AI 从业经验、微软 25 年的 AI 研究成果,以及他对赋予 AI 智商和情商的看法。

沈向洋之“北京遇上西雅图”

从西雅图到北京后,沈向洋先是回忆了自己小时候的故事和在微软亚研的工作经历:

“我这次回国之前,我想起自己小时候在南京的一些场景。现在的计算机可以改变整个世界,而在 80 年代整个南京市都没几台电脑。当时我父亲激励我,希望我可以用知识去改变世界。

后来我去了微软,微软给了我很好的机会去启动我们在北京的研究院。九年间,我的团队给我留下了深刻的印象。与此同时,微软亚洲研究院也取得了巨大成就,这让我感到自豪。

不仅每个产品不断有新的进展,而且在人工智能和计算机科学领域有着很前沿研究和探索。

此时此刻,大家就能看到我们的成果:同传。同声传译现在已经可以做到实时翻译,这些都是依靠人工智能实现的。

这次来到北京之后,又感觉到我在整个数字时代当中和整个社会产生了一种共鸣,当然,在这方面还有很多工作可以做,未来的路还很漫长。”

一、AI 可能是人类最重要的加速器

回顾人类创新史,人类发明了轮船、飞机、蒸汽机、火箭以及卫星等。但这些并不是物质方面的创新,其实它们所代表的都是一种加速度,是一种促使人类不断进步的源动力。相比而言,人工智能可能是最大的加速器,因为人工智能不仅延伸了人的物理能力、生理的能力,同时也延展了人类的脑力。

这不仅仅是数字时代新的一步,实际上也是人类的终极目标。

图灵展望了这个终极目标,他提出该目标的时候,计算机还没出现。后来人类有了大型机、桌面电脑、互联网、云、手机等。所有这些创新,实际上都只是一个热身而已,人类的终极目标,是人工智能。

人工智能都已经存在几十年,有起有伏,为何现在又要重提人工智能?人工智能有什么新颖的地方呢?

二、AI 的三大创新

AI 这六十年来,有三个创新点在不断加速人工智能:

  • 无处不在的传感器。
  • 大规模并行计算的发展,尤其是云计算的发展。
  • 算法的突破。

这些创新出现后,使得现在的人工智能无处不在。其实搜索引擎背后也有 AI 做支持,同时信用卡防欺诈、个人定制的新闻流、智能家居控制等等也均涉及到人工智能。

当下微软正在不断拓展人工智能方面研究的深度和广度,其中利用 AI 保护电子邮件帐户不要受到垃圾邮件的困扰,也借此优化翻译产品,而众所周知的微软小冰、小娜等则是典型的 AI 落地产品。

三、微软人工智能的最新进展

“当然,AI 的道路仍旧很长。人工智能目前是我个人主攻的方向,我已做好准备,迎接新一波人工智能潮流,而微软也为此准备了 25 年之久。”

盖茨在 25 年前建立了微软研究院,当时他设想未来应该有一个通用型人工智能:计算机可以看、听、说话甚至理解人的思想。微软在二十多年前启动了三大研究组:自然语言处理组、语音组、计算机视觉组。

在过去这么多年当中,微软吸引了全球最顶尖的人才到全球各地的实验室来迎接挑战。包括最近微软收购了 Maluuba,这是一支世界顶级的人工智能研究团队,其中前 Maluuba 顾问、深度学习领域中的杰出人物 Yoshua Bengio 此后将担任微软的特聘顾问。

那么微软在人工智能方面到底有哪些进展?

微软在计算机视觉方向的进展

在 CV 方面,微软有着二十多年的研究积累,而且已经接近人类的水平。

微软最近赢得了多项图像识别大奖,包括 ImageNet 竞赛等。能在大赛包揽多项大奖的很多成就都是通过深度神经网络来实现,其中有一个 152 层级的 Deep Residual Networks,它可以使得图像识别的精度不断提升,正确地识别 1000 多种物体的类别,并能达到 90% 的准确率。

更加让人激动的是,这些图像识别能力已落地为产品,包括今年会在中国上市销售的 Hololens。再比如说应用到 Uber 中可用识别工具来确认驾驶员的身份。

微软在语音和语义方向的进展

现在计算机已经可以像人一样去看,除此之外,它们也能够听懂人的话。沈向洋说:

几年前我还觉得计算机没有办法像人一样识别人的语言。然而现在微软已经成了一家能够让计算机听懂人说话的公司,其中微软拥有一个存在了 25 年的数据集。

目前整个世界有 6500 多种语言,任何一个人都不可能在一辈子当中学习 6500 多种语言 。

“可以试想一下,对人类而言,如果我们有非常棒的机器翻译产品,所有人在交流过程中就没有语言障碍了。前段时间,我们迈出很大一步,上线了微软全新翻译器,它可以同时支持用户与 100 多个说 9 种语言的人交流。

这就是人工智能的能力,AI 与机器翻译结合后,潜力是空前的,现在微软也在利用深度学习进一步加强翻译的能力。

沈向洋提到,研究者们必须用人工来对语音数据打标签,这需要大量的人工成本,而有了强化学习后,两台计算机课互相交流、互相教学。这里面有一个反向传播,它们可以学习把语言 A 翻成 B,然后再反过来输出结果。这使得不需要那么的人工,而且最终训练出来的翻译准确性非常高。这是亚洲研究院主攻的研究方向,而且在未来会有非常大的潜力。

四、人工智能的关键:知识图谱

当下,计算机已经能取代了人的部分工作。他们能看、能听,而且可以用语言来描述周围的世界。

但是除了做感知层面的研究外,还要做认知层的研究。这就需要把概念和想法连接起来,了解它们之间的关系。“概念与想法的连接”如果放在人类日常生活中,就可以理解为“常识”。

对人来说,构建常识图谱并不难,但是对计算机来说却是极具挑战性的任务。

过去这么多年中,微软一直在完善知识图谱。微软的 Bing 搜索引擎里有 60 亿的个物体和产品,这之间都有一定的关系。与此同时,微软还有 Office365 和 LinkedIn 这样的办公软件去完善知识图谱:把工作中的知识配合语音、语义、图像识别能力,创造出人工智能助理,帮助用户完成生活和工作上的服务。

五、人工智能的难题:认知建模

尽管在这方面取得一些成就,但人工智能只能实现普通的智能。在通用工作方面,AI 还不能和一个人类甚至是儿童进行比较。

婴儿必须要面临这样一个任务:在他来到这个世界上的时候,必须经过思考,需要对一些输入做出反映:比如微笑、触摸、发出声音,以及把他的不舒服,或者是饥饿的感觉传达出来。这是通过不断的试错完成的。这些孩子们如果一旦感受到“饿”的话,就学会了哭,这是一个了不起的成就。他也能够把他妈妈的声音和表情与自己的饥饿联系起来。随后他能够和妈妈进行沟通,能够解读并且了解他妈妈的面部表情,这对人来说是很自然而然的。

但是这对于人工智能来说却很难,对人类这些行为进行建模更难。那么 AI 该如何学习?

微软英国剑桥大学研究院有一个非常好的想法:在对 AI 进行测试时,可采用通用的世界,或者是数字化的世界来进行测试。这个数字化的世界好比真实世界一样,在测试时研究者能够对整个环境进行控制。

为此,微软推出 Malmo 项目,研究者可以通过《我的世界》游戏去测试人工智能算法。

在《我的世界》游戏中,玩家可以创造房屋建筑,甚至可以创造属于自己的都市和世界。这款游戏不仅可以单人娱乐,还可以多人联机。开发者们在该游戏中测试算法,十分有利于 AI 对“世界”感知和认知能力的建立。使他们不必开发机器人去操控实体对象。微软希望通过 Malmo 去加强通用人工智能的开发,包括指导人工智能程序学习,展开对话,做出决策,以及完成复杂的任务。

微软剑桥实验室研究员卡塔·霍夫曼(Katja Hofmann)表示,Malmo 可用于“强化学习”,即人工智能程序通过反复尝试和试错去学习,最终做出正确的选择,开发者也可以开发能相互交流的机器人。以下是该项目的视频链接:

http://www.yicai.com/live/5202745.html ,从第 22 分 10 秒开始。

沈向洋指出:

我们坚信 AI 对所有人都是适用的我们非常兴奋能够与其他合作伙伴开展合作,来解决人工智能相关问题。我们已经取得了很大的成就,但要建立一个通用型 AI 还有很多的事情要做。

这些未完成的事情还包括让计算机来了解人类,而非以往让人去学习和了解计算机。

让计算机去了解人类,这其实是一种双向的沟通,对计算机而言并不容易。这种和人类进行沟通的产品,我们把之称作“对话型 AI”,对话型 AI 是微软下一步要做的工作,即人类与机器展开交互。

六、机器如何与人类进行友好的交互 :让机器拥有 EQ 和 IQ

我们的构想是能够让计算机适用于所有人,用户不再需要去了解计算机和产品的操作方式,而是计算机去了解人类,而不是我们去了解它。

如果一个计算机能够和人进行沟通、和其他计算机进行沟通,那他们与人以及设备就能进行合作。

为了让这种对话型 AI 变为现实,微软关注一个很基本问题:HI 到底意味着什么,AI 到底意味着什么?

人类在进行每次沟通对话时,会有语音、语调、手势、面部表情等,也有讽刺、幽默以及夸张等不同的修辞。一个非常成功的 AI 必须要有非常好的情商,尤其是对话型 AI。

50 多年前,MIT 一位非常有名的教授发明了最早的数字助理设备,那个时候人们非常想和这个产品进行互动。现在人类已经取得了很大的进展,尤其从生产效能方面,微软有足够的 IQ 帮助人们更快、更容易地完成每天的工作。与此同时,微软也在 EQ 方面开展了很多工作,包括聊天机器人。在这个领域当中,很多人现在可能还没有考虑这样的话题,但微软已在进行不同的试验,并且在全球不同的市场上开展了这样的项目。

有了 EQ 和 IQ,人工智能才可以使这些计算变得真正个性化。

它们能够了解人们的日常,而且用户并不仅仅只和一个设备展开连接和交互,用户无论去哪儿,只要有需求,随时都可以与多个设备进行连接。

七、AI 让计算机拥有人的一些能力,同时也让人更强大

AI 不仅会让计算机变得更加智能,同时也会增强人类的势能。

AI 逐渐拥有人的一些能力,同时它会让人拥有“超能力”,应对各种各样的挑战。以教育为例,要掌握英语口语,人需要面对面进行沟通,但是老师可能同时和很多不同的学生进行沟通,他分给每个学生的精力非常有限。而 AI 却不会遇到这种问题。

微软不久前推出一个叫微软小英的产品,它是一个“英语老师”,可以通过微信公众号关注。小英刚上线不久就已有 8 万多用户,他们和小英一起练习改进英语水平。

AI 也可以帮助残障人士。微软研究人员对字词预测型键盘非常感兴趣,利用机器学习和自然语言处理技术帮助用户提高输入速度,根据历史输入记录,在输入内容时预测下一个词。该项目可帮助那些不能说话的人士。

AI 科技评论也曾报道过,微软在 2016 年收购了输入法公司 SwiftKey。SwiftKey 利用人工智能技术预测用户输入内容的输入法应用,其最著名的用户是史蒂芬·霍金。在霍金的眼镜上面有一个红外线开关,可以监测其脸颊传感器,让他在计算机上选择自己需要的字母。这款输入法甚至可以用一种特殊的语言模型帮助霍金讲话和写字,得益于 SwiftKey 的技术,极大地提升系统学习、预测字母和单词的能力。

演讲最后,沈向洋说到:

AI 的未来现在才刚刚开始,我对此充满希望。正如 Alan Kay 所说:我们对未来进行最好的预测就是发明未来。作为第一代 AI 从业者,发明未来就是我们想要做的事。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-01-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据和云计算技术

chat bot(聊天机器人)解密

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。 事实上,2017 年度秘已经占据了不少...

3967
来自专栏数说工作室

工作日鸡血 | 怎样雇佣一个数据科学家?不要给他们出测试题,编程、统计、数学才是需要考虑的!

新的一周开始了,各位宝宝们,加油哦! 此前我们看到的文章都是从面试、求职者角度出发的,本文从招聘者角度出发,为有数据科学家招聘需求的机构提供了9点建议。知己知彼...

2805
来自专栏量子位

视频网站Netflix说:以后俺们的顾客是AI,人类靠边站(???)

问耕 编译自Quartz 量子位·QbitAI 出品 [手动黑人问号脸] 这届巴展怎么了,怎么这么爱谈人工智能,怎么这么爱语出惊人??? 继前日孙正义语出惊人之...

3436
来自专栏CDA数据分析师

「专访」云幕后创始人王武佳:能对决策产生影响的数据分析才是有意义的数据分析

作者 CDA 数据分析师 『写在前面』 “每个人都需要具备数据分析能力”当被问及对数据分析的理解时,王武佳老师这样说到。 『人物介绍』 云幕后创始人 王武佳 ...

22210
来自专栏镁客网

比人类更强大的不是人工智能,而是掌握了人工智能的人类 | 科大讯飞年度发布会重磅发布三大板块、十项产品

1480
来自专栏企鹅号快讯

人工智能:我消灭你,但与你无关

出品AI龙门阵 如果我们把时间拉得足够长的话,那么现在人类的几十年寿命其实也不过是宇宙的一次眨眼而已,而整个人类历史也许仅仅是沧海一粟。而如果可以用我们的一眨眼...

1919
来自专栏镁客网

360度视频只是过渡,VR视频的“真交互”还没到时候

1604
来自专栏大数据文摘

谁来拯救你,我残缺的大数据?

28115
来自专栏鹅厂优文

游戏人工智能 读书笔记 (三) 游戏和人工智能的相互影响

Chapter 1.3 Why Games for Artificial Intelligence

1877
来自专栏人工智能头条

拥有人工智能的机器人能否取代人类?听大牛怎么说

2115

扫码关注云+社区