5 年前,如果你把猫的图片混在动物中,问Google 这是什么,Google八成会回答错误。
今天要是你再问Google 相同的问题,Google不仅会告诉你里面有一只猫,还能告诉你这是什么品种。
在这背后是机器学习技术的快速发展,如今它已不仅能看见、听见,而且也在学会理解人类世界。
快速发展的技术总会附带着不稳定性,机器学习也不例外。Elon Musk、霍金、比尔盖茨在不同的场合表达了对人工智能的担忧,他们认为当有一天机器智能超越人类,我们将可能面临毁灭之灾。
在他们的隐忧背后,最为核心的是人工智能的黑盒问题。
什么叫黑盒问题?
在深度学习系统中,人工智能表现出如同“黑色盒子”的封闭性。以 Google 为例,即便现在已经能够识别出图片中的小猫和小狗,但如果深究这个过程是如何发生的,却没有人知道。神经网络的分类器和特征模块都有自动学习的特性,而且微小的改变,都会对结果产生巨大的影响:我们已经看过很多“愚弄”神经网络的例子了,用一些微小的扰动,让神经网络把粉红竖条纹错误识别为棒球,把上图左二识别为海星。
这很难避免,因为你不知道神经网络会在什么地方收敛,也很难解释它的所作所为。神经网络有一种非确定性的本质,它在很多时候是很难进行解释的。
黑盒问题:企业彼此难以合作
对于人工智能的企业来说,黑盒问题的影响倒不是“强人工智能”问题,而是和产业自身的发展以及合作密切相关。对于一个国家来说,它考虑的不仅仅是一个企业的利益,而是要把一个行业整体提升起来,在世界范围内开展强有力的竞争。例如说德国的精密制造业,日本的服务机器人闻名于世,我们在看到企业自身努力的同时,也不应该忘记国家、协会在背后出台的行业标准,让各家企业即便彼此竞争,也能通力合作。
语义理解是中国人工智能非常关键的领域,而如果考虑到它背后的中文属性,更是中国企业必须拿下的桥头堡。所以作为国家来说,当然也必须推行相应的标准:例如今天在北京举办的智能客服语义库标准启动会。
这个启动会由工信部电子技术标准研究院和小 i 机器人主办,参与方包括了清华软件学院、招商银行、LG、格兰仕等单位。在启动会开始之前,这个标准已经在 2015 年第二批国家标准修订计划中正式获批,由信标委归口。
这些企业和事业单位希望能够通过国家标准的形式,把语义理解在智能客服领域的应用在一定程度统一起来,以此形成行业合力。
黑盒如何“透明化”?
语义是认知领域的核心概念,但多少也属于黑盒的问题。在语义理解自身的框架下,几乎无法避免黑盒的状态:各家企业在自己的范围做数据分析、知识图谱、通用及专用语义,积累自己的语义库,遵循自己的框架和规则,在输入到输出之间也很难进行追溯。换言之,几乎很难进行企业合作。
神经网络算法难以追溯,而数据又得保密,那么如何进行行业间的合作?
小 i 机器人总裁兼 CTO 朱频频表示说:“在一个一个垂直领域的渗透过程中我们发现:在语义层,不同的行业之间也是有很多共通的部分,可以被规则化和结构化。从而可以做一些标准化的东西出来。”
具体到智能客服领域,指的是虽然在不同的垂直领域中需要分别输入知识,但是在这背后有一些共同的地方,例如抽象语义和结构框架。
智能客服语义库,提供了一套对通用和行业领域知识的共享和共同知识,形成统一标准后,能有效降低构建机器人服务系统的复杂度和建设成本,加速智能服务机器人在更多行业的快速落地。
语义库涉及到非常多方面,包括词类、命名实体、本体、语义表达式、原子知识、抽象语义等。我们以“本体”简单举一个例子:
在这幅图中,本体类是通过继承关系来组织结构的,子类会继承父类的所有属性,以及属性的语义。例如“人”和“婴儿”这两个本体类,“婴儿”是“人”的一个子类,所以“婴儿”类继承了“人”这个子类的所有属性。相似的,“新生儿”是婴儿的子类,所以就同时继承了“婴儿”和“人”的所有属性。
这个方法很巧妙,虽然没能解决语义理解的黑盒问题,但找到了一个互通的方法。把垂直行业的共同语义,框架结构抽象出来,各家企业可以在这个结构下填充自己的数据。所以虽然各企业实际运行的还是黑盒子,但通过“标准”的形式联通起来了。
当不同的领域都采取相同的抽象语义库时,不仅搭建智能客服系统更为简单,后期对它的维护也能够有规可循。这样就既有搭建智能客服系统的企业,又有对此维护的企业,还有基于系统进行增值服务的企业。智能客服的生态,也就这样建立起来了。
在大会中小 i 机器人和招商银行也进行了分享,招商银行使用了小i 的智能客服系统,其服务创新室经理于欧说:“这些知识的积累让人机交互更为顺畅,让我们的服务品质更高,参与标准的制定,把我们已有的这些积累分享出来,正是为了让更多的行业快速享用这种新兴技术的利好。”
而对于国内智能客服助手领域占据主导地位的小 i 而言,这也是一次非常好的机会,把智能客服的服务推广到更多的行业。可以预计,从智能客服出发,在国家的语义库标准和小 i 等企业的共同努力下,我们能更快享受到人工智能的技术红利。