前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >图像的表示(1):入门音视频前,你真的了解图像吗?丨音视频基础

图像的表示(1):入门音视频前,你真的了解图像吗?丨音视频基础

作者头像
关键帧
发布2022-06-13 12:08:37
3670
发布2022-06-13 12:08:37
举报
文章被收录于专栏:关键帧Keyframe

文森特·梵高《星空》像素版

(本文基本逻辑:图像的定义是什么 → 图像成像的原理是什么 → 怎样对图像进行数学描述 → 怎样对图像进行数字化 → 数字图像数据是什么)

在了解了音频的基础知识后,我们理应对应的去介绍视频。但如果简单来看,视频其实就是按时间序列组合在一起的一组图像,因此想要了解视频,首先要知道图像的本质是什么。在这篇文章里,我们依然先提出一个问题:从我们眼睛看见的『画面』,到我们用手机、电脑所处理的『图像数据』,其中经历了什么?从这个问题出发,我们来浅浅的探讨一下:日常开发工作中处理的图像数据,是如何从现实的光影世界映射而来。

我们将上面的问题细分为几个子问题一一探讨:

  • 图像的定义是什么?
  • 图像成像的原理是什么?
  • 怎样对图像进行数学描述?
  • 怎样对图像进行数字化?
  • 数字图像数据是什么?

1、图像的定义是什么?

『看见』,对我们来讲是非常稀松平常的一种能力,如果把我们看见的画面叫做图像,那怎么定义它呢?从维基百科找到的图像的定义如下:

图像是人对视觉感知的物质再现。图像可以由光学设备获取,如照相机、镜子、望远镜及显微镜等;也可以人为创作,如手工绘画。图像可以记录、保存在纸质介质、胶片等等对光信号敏感的介质上。随着数字采集技术和信号处理理论的发展,越来越多的图像以数字形式存储。

上述定义里有两个关键词:『视觉感知』和『物质再现』。前者对应着图像成像的过程,后者对应着图像信号处理的过程。

2、图像成像的原理是什么?

2.1、我们怎样看见图像?

那人眼是怎么做到视觉感知的呢?

人眼能够看到物体,是因为人眼的晶状体结构相当于一个凸透镜,物体的反射光通过晶状体折射成像于视网膜上,再由视觉神经感知传给大脑,这样人就看到了物体。这就是物体在人眼成像的原理。

当我们探讨数字图像时,那必然也需要对应的设备承担类似人眼的功能来实现『视觉感知』,日常生活中最常见的这类设备就是相机,它们的成像原理也类似人眼的成像原理。

相机利用光的直线传播性质和光的折射与反射规律,以光子为载体,把某一瞬间的被摄景物的光信息量,以能量方式经镜头传递给感光材料(模拟的胶卷或数字的硅片),最终成为可视的影像。

对于成像原理,在很多应用场景中将镜头当做理想的针孔,对照小孔成像原理来理解就足够了,上面介绍的人眼和相机的成像原理即是如此。但是,如果要处理诸如焦距、曝光、虚影和像差等问题,就需要提出更复杂的模型,这是光学要研究的问题,我们这里就不做过多探讨了。

成像原理是我们感知到图像的存在的原因,那我们感知到的图像的颜色又是怎么回事呢?

2.2、我们怎样感知颜色?

我们为什么能感知到『颜色』?答案是因为物体发出或反射的光。早在之前,人类就发现光是一种电磁波,而人类视觉系统中有三种不同的椎体细胞,它们分别对不同波长段的光最敏感,视锥细胞形成的视觉信号复合后为人呈现了色彩缤纷的世界,这是人眼视觉感知三原色理论。人类并不能看见所有的电磁波,因此把能看见的电磁波称为可见光,对应的波长在 380-780 nm 之间。我们日常所见的大多数光,都是不同波长的光组合而成,因此我们才能看到这么多颜色。比如太阳光,它就是由多种不同颜色的光组合而成,牛顿很早的时候就用棱镜揭示过这个事实:白光包含所有可见光谱的波长

人类视觉系统中有三种不同的椎体细胞,它们分别对黄绿色、绿色和蓝紫色的光最敏感。第一种对长波长的光响应最大,峰值波长约为 560 nm,有时将这种类型视锥细胞称为 L。第二种类型对中波长的光响应最大,在 530 nm 处达到峰值,通常简称为 M。第三种类型对短波长的光响应最大,在 420 nm 处达到峰值,简称为 S。人类视锥细胞的峰值响应因人而异,所以这三种类型的峰值波长要取决于个人,它们的范围在 564–580 nm,534–545 nm 和 420–440 nm 附近。 这三种类型不完全对应于如我们所知的特定的颜色。相反,对颜色的感知是由一个开始于这些位于视网膜的细胞差异化的输出,且将在大脑的视觉皮层和其它相关区域中完成的复杂的过程实现的。例如,尽管 L 视锥细胞简称为红色感受器,紫外可见分光光度法表明它们的峰值敏感度在光谱的绿黄色区域。类似的,S 视锥细胞和 M 视锥细胞也不直接对应蓝色和绿色,尽管它们经常被这样描述(在很多资料的描述中,人眼的三种椎体细胞敏感的光分别对应 630 nm 的红光、530 nm 的绿光和 450 nm 的蓝光,因此才把 RGB 作为三基色)。实际上 RGB 颜色模型仅仅是用以表达颜色的一个方便的方式,而不是直接基于人眼中的视锥细胞类型。

当我们把人眼对颜色的感受进一步细化,它可以分为如下几个特征:

  • 色调(hue)。太阳或灯泡等光源发射可见波段的全部频率而产生白色光。当白色光投射到一个物体上时,某些频率被反射,某些则被物体吸收了。在反射光中混合的频率确定了我们所感受到的物体的颜色。如果在反射光中以低频率为主,则物体呈现红色。此时,我们可以说光谱中红色端有一个主频率(或主波长),也称为光的色调。
  • 亮度(brightness)。对应于光的能量大小,可量化为光源亮度。
  • 饱和度(saturation)。对应于光的颜色表现接近光谱色(例如红色)的程度。浅色或暗淡的颜色的饱和度较低,它们比较接近白色。

还有另外一个术语色度(chromaticity)通常是说明『饱和度』和『色调』这两种特征的综合表现。

以上便是我们的视觉感知到图像及其颜色的原因。

(通过上文的探讨,我们了解了图像定义以及我们是如何感知到图像及其颜色的基础知识。对于图像进行数学描述的问题,由于篇幅较长,我们将在后面用完整的一篇文章来探讨,敬请期待)

- 完 -

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 关键帧Keyframe 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、图像的定义是什么?
  • 2、图像成像的原理是什么?
  • 2.1、我们怎样看见图像?
  • 2.2、我们怎样感知颜色?
  • - 完 -
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档