机器学习的困境和出路

当前问题

数据量问题

神经网络是以输入为导向的算法,优质结果取决于无穷量的数据。但无穷量的数据不仅难以获取,而且不免有事实枚举之嫌。

场景限制

当前研究成果都局限在特定场景下,换言之,当下人工智能的发展避不开种种限制条件,因而智能的机器也只能够照章办事,没有任何灵活性,也达不到人们想要的智能。

抗干扰性

基于数据驱动的算法抗干扰性较差,在大量样本的训练下,系统仍会犯重大的错误。如商汤、旷视等头部企业也表示,即便训练出的系统模型准确率高达99%,但在实际应用中,系统仍然会犯很多“弱智”的错误。

努力方向

建立一个统一的理论

现有的机器缺乏推理能力的原因在于它没有常识。清华大学人工智能学院院长张钹院士通过实验验证,常识的建立确实会极大程度的提升机器的性能。而为机器建立常识库也成为人工智能企业进一步提升系统性能的第一步。美国在1984 年就搞了这样一个常识库的工程,做到现在还没完全做出来。可见,要走向真正的人工智能,有理解的人工智能,是一条很漫长的路。

想要提升智能的第二步,在张院士看来,就是将感性和知识的世界统一起来,而这将为人工智能的发展带来一次质的飞跃。具体来说就是将行为(特征向量)和数据(符号向量)结合起来,就是把这特征向量空间和符号向量投射到语义向量空间。只有解决这些问题,我们才能够建立一个统一的理论。因为在过去,对感知和认知的处理方法是不同的,因而两者不在同一维度,无法统一处理。但如果我们能够将感知和认知投射到同一空间,我们就可以建立一个统一的理论框架,并在语义向量空间里解决理解问题。

模糊计算

美国犹他州立大学计算机系终身教授承恒达指出无论是知识图谱,语义向量空间还是当下的其他深度学习训练,它们都是基于概率统计理论,而模糊逻辑不是,它是以模糊集理论为基础的。

大道至简

哲学告诉我们,通过越来越大的数据,越来越深的神经网络层级来训练模型显然不是正确的方向。人类如果按照这种方式来教小孩认识一只猫,估计早把这小孩给扔了。加州大学伯克利分校电子工程与计算机系教授马毅指出真正的优质算法一定是最简单的,比如迭代、递归,还有经典的ADMM,这些简单的算法就很好,也很有用。

未来出路设想

通过拿计算机跟人类学习方式比较可知,根本性的差异在于思维结构或者说脑结构的不同。灌输式的数据喂养,也许是当下能做到的最愚蠢方式,想办法提升计算机体系结构才是根本出路。也许21世纪中期都不可能出现,但还是拭目以待。

在体系结构改进的基础上的基于小样本的监督学习和强化学习。这里包含几个要点:

小样本,小数据

基于人类专家的大数据监督学习

在此基础上的强化学习

就像要想炼成绝世武功,不仅要有顶尖大师手把手的监督训练,而且还要有后天苦练的强化学习,才有可能成为一代武学大师。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181212G0DX2700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券