首页
学习
活动
专区
工具
TVP
发布

人类:你识谁?机器人:我识你的局部美小科爱

文章仅为阅读体会,

切勿当作正式科普。

看到标题>点开文章>继续下拉……

这些你可以轻而易举做到的动作,是现在科学界最想做出突破的研究。通过摄像头、图像识别,让机器人“看”已经实现了。

但机器人和人类看到的画风完全不同,例如同样是看到一条手臂。

人看到的总是别出心裁

一本正经的机器人看到的

这一堆搞得人头晕目眩的数字,到底是什么来头?

它代表每一个小区块的亮度,愈大的数表示愈亮,愈小的数表示愈暗。每一数字的变化就是一个信号源,机器人以此识别物体,以及与物体的距离。

对于人则是眼睛收到信号,然后快马加鞭传递给大脑总部,总部负责这片儿的部门以释放神经纤维的激活率作为反馈。

不然不能准确及时的识别物体,可能人一头就奔墙上撞去还不自知。

机器要做到识别这一点非常困难,刚出生的小孩总是横冲直撞,因为她分不清物体边缘和背景的区别。

物理世界映射到人眼中的是一个由许多小阴影碎片搭成的图案,而大脑需要通过“实时构图”让这些碎片产生真实连接(建模)。

放在机器理解程序里,就是要寻找大数和小数相接的地方。那堆数字是立体的,随着物体摆放位置的改变,代表物体厚度、高度和形状的相应数字都在变化。

通过对距离、光暗和阴影的识别,可以准确定位出物体大小和位置。

第二步需要知道物体的材质了,例如眼睛如何区分薯条和汉堡?

照到视网膜上光的数量,不仅取决于物体的灰暗度,还有光本身的明亮度。

有一条我们吃货才懂的理论,薯条和汉堡放在一起,喜欢薯条的人总觉得它比汉堡更亮眼……

经我边吃边思考分析,除了食味作用,和视觉对色泽反光的反馈很有关系。

薯条+包装就红黄两色,视觉能很快识别,依据懒是人类天性的特点,薯条就友好多了,所以先看好它哟。

浑身全包的汉堡,撕开是错综复杂的色泽,这让眼睛识别有点费神啊,所以相比薯条,它只能排其次了。

对于正常生活需求而言,我们只需要视觉分清它是薯条或汉堡就可以了。如此我们意识中对颜色和亮度的感知就能和物理世界保持一致。

如果细较分解的话,物理世界投射到我们视网膜上的色状镜像分类非累死人不可,这就是我们视觉系统的神奇设计之处。

眼睛只能负责收集三维世界的信息,转化为二维的视网膜图像,背后则必须由大脑来操刀。

视网膜是一个单纯无邪的孩子,在它看来,你手里的一张纸币和远方的金山银山一样,大小相同。

要回味这种神经机制的运作现象,盯着灯泡看几秒,眼前暂时就会出现一小块白色,盯着书看这块白色有几厘米大,盯着墙看会有几米,盯着天空就更大了。

机器识物最直接的方式是建模,就像筛子一样,只有等于或小于筛孔的沙子才能穿过去。这种方式比较鸡肋,例如手写不太规范的A,机器就不认亲了。

人工智能发展到现在,虽然有40多年,但目前也仅能识别规范的、已知的物体。对于现在这个变化莫测的世界,人工智能在很多方面就一筹莫展了。

所以科学家想的对策是识别关键部位,比如出入一家小区,它不会将人从头到脚识别个遍,只扫描虹膜或视网膜血管的清晰形状就得(dei)了。

而我们大脑就厉害了,看过的该记的和不该记的,可以看的和少儿不宜的,都能快速有条理的归档,想用又能随时调用。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180207A0RYY000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券