乱弹:脸盲症与机器学习

机器学习现在很火。火到什么程度呢,火到嚷嚷着“人工智能”要来了的文章几乎遍地都是。

要评论一个东西,得先学习它。我也花了不少时间了解学习了一下。

机器学习基本的假设是,给足够多的训练数据,机器(程序)可以“学习”出来一个相当不错的结果。比如人脸识别,现在已经广泛应用了。

这个人脸识别的训练过程,大致就是你给程序输入很多组照片,每组两张,再告诉程序这两张是来自同一个人还是不同的人,如此重复很多次之后,机器就能自己学会辨别两张照片是否是同一个人。

听起来挺神奇的,是吧。然后,我就又要胡思乱想了。

据说有不少人是患有“脸盲症”的。这些脸盲症患者不能有效率地区分人脸的同不同。可是说起来,这些脸盲者,有着更加复杂的神经网络,训练的数据按说也不少,从小到大,看过的“训练数据”也不少啊。

要是在承认基于神经网络的学习方法是有效的这个基础上排查的话,那么

脸盲症患者的神经网络拓扑结构有问题。

脸盲症患者的训练样本数据还是太小。换句话说,认识的人太少。

数据标注其实错误不少。

要是第一点的话,那悲剧了,先天因素。而且你还别说,似乎真的有研究表明,是因为“部分脑子可能有问题”。

要是第二点的话,似乎也悲剧了,它残酷地表明了你不想承认的事实。

要是第三点的话,你最好祈祷别人没有发现,原来你一直都是把张三当成李四,王五当成赵六的。

作为轻度脸盲症患者,这样看来,要午饭吃不香了。

不过给人绝望的同时,一定是要给人希望的。

脸盲症患者比较适合练习佛祖的“白骨观大法”。不管是俊男美女,风流才俊,还是精英权贵,反正都分不清楚,看成白骨练习起来就容易多了。

另外“部分脑子可能有问题”,并没有说“脑子全部有问题”,也没否认“其他部分脑子因此得到加强”的可能性。所以啊,也许咱在别的方面是天才呢。

咱们再回头看看人脸识别的机器学习,根据其实现原理,你的脸最终被编码成了可能一组比特位信息。就算是4096比特位吧,这不少了,因为理论上有2的4096次方个不同的值呢。而目前全地球的人口总数也就在2的33次方左右。所以呢,不管是怎样的脸,其信息含量,作为文件存在磁盘上的话,也就512个字节,作为一个文件的话,你大概都不屑于打开看一眼的。

是,非,非是,非非,非是非

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180629G0N02N00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券