语义理解:黑盒也能“透明化”?

5 年前,如果你把猫的图片混在动物中,问Google 这是什么,Google八成会回答错误。

今天要是你再问Google 相同的问题,Google不仅会告诉你里面有一只猫,还能告诉你这是什么品种。

在这背后是机器学习技术的快速发展,如今它已不仅能看见、听见,而且也在学会理解人类世界。

快速发展的技术总会附带着不稳定性,机器学习也不例外。Elon Musk、霍金、比尔盖茨在不同的场合表达了对人工智能的担忧,他们认为当有一天机器智能超越人类,我们将可能面临毁灭之灾。

在他们的隐忧背后,最为核心的是人工智能的黑盒问题。

什么叫黑盒问题?

在深度学习系统中,人工智能表现出如同“黑色盒子”的封闭性。以 Google 为例,即便现在已经能够识别出图片中的小猫和小狗,但如果深究这个过程是如何发生的,却没有人知道。神经网络的分类器和特征模块都有自动学习的特性,而且微小的改变,都会对结果产生巨大的影响:我们已经看过很多“愚弄”神经网络的例子了,用一些微小的扰动,让神经网络把粉红竖条纹错误识别为棒球,把上图左二识别为海星。

这很难避免,因为你不知道神经网络会在什么地方收敛,也很难解释它的所作所为。神经网络有一种非确定性的本质,它在很多时候是很难进行解释的。

黑盒问题:企业彼此难以合作

对于人工智能的企业来说,黑盒问题的影响倒不是“强人工智能”问题,而是和产业自身的发展以及合作密切相关。对于一个国家来说,它考虑的不仅仅是一个企业的利益,而是要把一个行业整体提升起来,在世界范围内开展强有力的竞争。例如说德国的精密制造业,日本的服务机器人闻名于世,我们在看到企业自身努力的同时,也不应该忘记国家、协会在背后出台的行业标准,让各家企业即便彼此竞争,也能通力合作。

语义理解是中国人工智能非常关键的领域,而如果考虑到它背后的中文属性,更是中国企业必须拿下的桥头堡。所以作为国家来说,当然也必须推行相应的标准:例如今天在北京举办的智能客服语义库标准启动会。

这个启动会由工信部电子技术标准研究院和小 i 机器人主办,参与方包括了清华软件学院、招商银行、LG、格兰仕等单位。在启动会开始之前,这个标准已经在 2015 年第二批国家标准修订计划中正式获批,由信标委归口。

这些企业和事业单位希望能够通过国家标准的形式,把语义理解在智能客服领域的应用在一定程度统一起来,以此形成行业合力。

黑盒如何“透明化”?

语义是认知领域的核心概念,但多少也属于黑盒的问题。在语义理解自身的框架下,几乎无法避免黑盒的状态:各家企业在自己的范围做数据分析、知识图谱、通用及专用语义,积累自己的语义库,遵循自己的框架和规则,在输入到输出之间也很难进行追溯。换言之,几乎很难进行企业合作。

神经网络算法难以追溯,而数据又得保密,那么如何进行行业间的合作?

小 i 机器人总裁兼 CTO 朱频频表示说:“在一个一个垂直领域的渗透过程中我们发现:在语义层,不同的行业之间也是有很多共通的部分,可以被规则化和结构化。从而可以做一些标准化的东西出来。”

具体到智能客服领域,指的是虽然在不同的垂直领域中需要分别输入知识,但是在这背后有一些共同的地方,例如抽象语义和结构框架。

智能客服语义库,提供了一套对通用和行业领域知识的共享和共同知识,形成统一标准后,能有效降低构建机器人服务系统的复杂度和建设成本,加速智能服务机器人在更多行业的快速落地。

语义库涉及到非常多方面,包括词类、命名实体、本体、语义表达式、原子知识、抽象语义等。我们以“本体”简单举一个例子:

在这幅图中,本体类是通过继承关系来组织结构的,子类会继承父类的所有属性,以及属性的语义。例如“人”和“婴儿”这两个本体类,“婴儿”是“人”的一个子类,所以“婴儿”类继承了“人”这个子类的所有属性。相似的,“新生儿”是婴儿的子类,所以就同时继承了“婴儿”和“人”的所有属性。

这个方法很巧妙,虽然没能解决语义理解的黑盒问题,但找到了一个互通的方法。把垂直行业的共同语义,框架结构抽象出来,各家企业可以在这个结构下填充自己的数据。所以虽然各企业实际运行的还是黑盒子,但通过“标准”的形式联通起来了。

当不同的领域都采取相同的抽象语义库时,不仅搭建智能客服系统更为简单,后期对它的维护也能够有规可循。这样就既有搭建智能客服系统的企业,又有对此维护的企业,还有基于系统进行增值服务的企业。智能客服的生态,也就这样建立起来了。

在大会中小 i 机器人和招商银行也进行了分享,招商银行使用了小i 的智能客服系统,其服务创新室经理于欧说:“这些知识的积累让人机交互更为顺畅,让我们的服务品质更高,参与标准的制定,把我们已有的这些积累分享出来,正是为了让更多的行业快速享用这种新兴技术的利好。”

而对于国内智能客服助手领域占据主导地位的小 i 而言,这也是一次非常好的机会,把智能客服的服务推广到更多的行业。可以预计,从智能客服出发,在国家的语义库标准和小 i 等企业的共同努力下,我们能更快享受到人工智能的技术红利。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-12-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云社区全球资讯抢先看

为什么ICA是真正的ECM

ICA(Intelligent component analysis/智能内容分析),将为企业提供一个丰富的我们在过去认为不可能的预测信息领域。

2133
来自专栏AI科技评论

业界 | AI算法与道德规则如何平衡?IBM推出AI推荐技术

AI 科技评论按:近两年,以今日头条为代表的信息推荐引擎大火,根据用户的阅读行为,AI算法可以精准地把握用户喜好,为用户推荐他们爱看的内容。这样,信息推荐引擎不...

1074
来自专栏全栈数据化营销

精益数据分析:对商业模式、创业阶段、数据指标、数据测试方法的数据分析

随着“数据驱动产品设计”的理念被越来越多的公司所认可,越来越多的人认识到数据分析的重要性,数据分析也成为产品经理的一项必备技能。但是到我们在进行数据分析的过程中...

2855
来自专栏CDA数据分析师

避免这7个数据错误,让你的数据分析更有效率!

? 编译 Harris 本文转自机房360,转载需授权 数据正在成为现代企业的一个更重要的工具,几乎可以作为一种货币,它可以从衡量营销活动的有效性到评估员...

3528
来自专栏AI科技评论

为什么说工业机器人的那双“慧眼 ” 并不聪慧? | 硬创公开课

过去的工业机器人,在我们眼中一直是一些冷冰冰的自动化设备,但随着计算机视觉的应用,它慢慢变成了一个有感官,有思维,有情感的新一代工业机器人,并推动着现在珠三角、...

2819
来自专栏WOLFRAM

Stephen Wolfram:如何训练孩子们的计算思维(III)

1605
来自专栏CDA数据分析师

想入门数据分析,现在转行还来得及吗?

2014年,“大数据” 成为国内年度热词,并首次出现在当年的《政府工作报告中》。同年,数据分析也同样成为朝阳行业,数据分析一度霸屏各招聘网站。

781
来自专栏大数据文摘

信息爆炸的时代,如何成为更高效的学习者?

1324
来自专栏机器人网

如何选购合适的工业机器人?

在“机器换人”大热的今天,不少老板都希望能用工业机器人来替换工人,既解决用工荒的问题,同时还能进一步提升生产效率,降低成本。可是,你知道怎么选择一个合适的工业机...

2626
来自专栏华章科技

Google IO:创新技术后的大数据

为什么这么说呢?让我们先看看公布的一款重量级产品:GoogleAssistant(谷歌助手)。和苹果的Siri、微软的Cortana、以及Amazon的Alex...

762

扫码关注云+社区