语义理解:黑盒也能“透明化”?

5 年前,如果你把猫的图片混在动物中,问Google 这是什么,Google八成会回答错误。

今天要是你再问Google 相同的问题,Google不仅会告诉你里面有一只猫,还能告诉你这是什么品种。

在这背后是机器学习技术的快速发展,如今它已不仅能看见、听见,而且也在学会理解人类世界。

快速发展的技术总会附带着不稳定性,机器学习也不例外。Elon Musk、霍金、比尔盖茨在不同的场合表达了对人工智能的担忧,他们认为当有一天机器智能超越人类,我们将可能面临毁灭之灾。

在他们的隐忧背后,最为核心的是人工智能的黑盒问题。

什么叫黑盒问题?

在深度学习系统中,人工智能表现出如同“黑色盒子”的封闭性。以 Google 为例,即便现在已经能够识别出图片中的小猫和小狗,但如果深究这个过程是如何发生的,却没有人知道。神经网络的分类器和特征模块都有自动学习的特性,而且微小的改变,都会对结果产生巨大的影响:我们已经看过很多“愚弄”神经网络的例子了,用一些微小的扰动,让神经网络把粉红竖条纹错误识别为棒球,把上图左二识别为海星。

这很难避免,因为你不知道神经网络会在什么地方收敛,也很难解释它的所作所为。神经网络有一种非确定性的本质,它在很多时候是很难进行解释的。

黑盒问题:企业彼此难以合作

对于人工智能的企业来说,黑盒问题的影响倒不是“强人工智能”问题,而是和产业自身的发展以及合作密切相关。对于一个国家来说,它考虑的不仅仅是一个企业的利益,而是要把一个行业整体提升起来,在世界范围内开展强有力的竞争。例如说德国的精密制造业,日本的服务机器人闻名于世,我们在看到企业自身努力的同时,也不应该忘记国家、协会在背后出台的行业标准,让各家企业即便彼此竞争,也能通力合作。

语义理解是中国人工智能非常关键的领域,而如果考虑到它背后的中文属性,更是中国企业必须拿下的桥头堡。所以作为国家来说,当然也必须推行相应的标准:例如今天在北京举办的智能客服语义库标准启动会。

这个启动会由工信部电子技术标准研究院和小 i 机器人主办,参与方包括了清华软件学院、招商银行、LG、格兰仕等单位。在启动会开始之前,这个标准已经在 2015 年第二批国家标准修订计划中正式获批,由信标委归口。

这些企业和事业单位希望能够通过国家标准的形式,把语义理解在智能客服领域的应用在一定程度统一起来,以此形成行业合力。

黑盒如何“透明化”?

语义是认知领域的核心概念,但多少也属于黑盒的问题。在语义理解自身的框架下,几乎无法避免黑盒的状态:各家企业在自己的范围做数据分析、知识图谱、通用及专用语义,积累自己的语义库,遵循自己的框架和规则,在输入到输出之间也很难进行追溯。换言之,几乎很难进行企业合作。

神经网络算法难以追溯,而数据又得保密,那么如何进行行业间的合作?

小 i 机器人总裁兼 CTO 朱频频表示说:“在一个一个垂直领域的渗透过程中我们发现:在语义层,不同的行业之间也是有很多共通的部分,可以被规则化和结构化。从而可以做一些标准化的东西出来。”

具体到智能客服领域,指的是虽然在不同的垂直领域中需要分别输入知识,但是在这背后有一些共同的地方,例如抽象语义和结构框架。

智能客服语义库,提供了一套对通用和行业领域知识的共享和共同知识,形成统一标准后,能有效降低构建机器人服务系统的复杂度和建设成本,加速智能服务机器人在更多行业的快速落地。

语义库涉及到非常多方面,包括词类、命名实体、本体、语义表达式、原子知识、抽象语义等。我们以“本体”简单举一个例子:

在这幅图中,本体类是通过继承关系来组织结构的,子类会继承父类的所有属性,以及属性的语义。例如“人”和“婴儿”这两个本体类,“婴儿”是“人”的一个子类,所以“婴儿”类继承了“人”这个子类的所有属性。相似的,“新生儿”是婴儿的子类,所以就同时继承了“婴儿”和“人”的所有属性。

这个方法很巧妙,虽然没能解决语义理解的黑盒问题,但找到了一个互通的方法。把垂直行业的共同语义,框架结构抽象出来,各家企业可以在这个结构下填充自己的数据。所以虽然各企业实际运行的还是黑盒子,但通过“标准”的形式联通起来了。

当不同的领域都采取相同的抽象语义库时,不仅搭建智能客服系统更为简单,后期对它的维护也能够有规可循。这样就既有搭建智能客服系统的企业,又有对此维护的企业,还有基于系统进行增值服务的企业。智能客服的生态,也就这样建立起来了。

在大会中小 i 机器人和招商银行也进行了分享,招商银行使用了小i 的智能客服系统,其服务创新室经理于欧说:“这些知识的积累让人机交互更为顺畅,让我们的服务品质更高,参与标准的制定,把我们已有的这些积累分享出来,正是为了让更多的行业快速享用这种新兴技术的利好。”

而对于国内智能客服助手领域占据主导地位的小 i 而言,这也是一次非常好的机会,把智能客服的服务推广到更多的行业。可以预计,从智能客服出发,在国家的语义库标准和小 i 等企业的共同努力下,我们能更快享受到人工智能的技术红利。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-12-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

人工智能堵住了应试教育的华容道

人工智能的大数据训练和应试教育的刷题训练,在训练模式上具有高度相似性。但在算力和大数据处理上,人工智能具有人脑无法企及的天然优势。人工智能正逐渐替代流程化和重复...

472
来自专栏新智元

【AI芯片格局最全分析】国内AI芯片百家争鸣,何以抗衡全球技术寡头

1013
来自专栏量子位

IBM量子计算机商业化突破:发现模拟分子的新方法

安妮 编译自 Bloomberg 量子位 出品 | 公众号 QbitAI 今天,IBM的研究人员宣布了一种在量子计算机上模拟分子结构的新方法,这项研究还上了科学...

2994
来自专栏AI启蒙研究院

@所有人,为什么突然之间所有人都在讨论人工智能

522
来自专栏孟永辉

改造尚未完成,互联网家装仍将洗牌

2645
来自专栏人工智能

六本书解读人工智能

编者按 人工智能取得一个又一个成功,AlphaGo Zero 说明了奇点论的可靠性,AI 的发展速度比人们想象得要更快。牛津大学最新的研究数据显示,20 年内将...

1965
来自专栏华章科技

【深度长文】人工智能过去60年沉浮史,未来60年将彻底改变人类

导读:对于人工智能来说,前60年的人工智能历程,可以用“无穷动”来形容;后60年的人工智能发展,可以用“无穷大”来期许。

682
来自专栏孟永辉

深耕、跨界、融合:互联网家装的自我革新之路

2737
来自专栏孟永辉

互联网红利落幕、资金压力加大,互联网家装如何破局?

1865
来自专栏华章科技

中兴禁令扎“芯”了吗?揭秘AI芯片国内外现状

导读:近日,美国对中兴发起一张长达七年的禁令,在这期间,美国公司将禁止向中兴出售任何元器件。有分析认为,美国禁令直击中国软肋,简直扎“芯”。那么在AI领域,国内...

622

扫描关注云+社区