多媒体与通信是个即传统有新潮的领域,在这几天的Google I/O、微软Bulid大会上,AI让数字助理让个人生活和会议变得更加轻松有趣,这背后有不少多媒体技术默默的贡献。
文 / Ant
过去几个月,我常常思考一个问题——多媒体(通信)技术到底解决什么问题?交付什么样的服务呢?目前得到的答案是:
以更低的成本,呈现更身临其境的视听感受。
“成本”和“身临其境”形成了一对矛盾,这就对多媒体(通信)技术提出了挑战。从贝尔发明电话,到即将到来的5G网络,人类都在想方设法在有限的网络条件下传输更多的数据。换句话说,需要尽可能的压缩数据,但不同的数据集压缩的比例并不一样。比如,电影中一段纯色的蓝天的视频,压缩后和一张蓝天的图片大小差不多,甚至更小。这是由于数据中的冗余信息非常大造成的,而信息中的非冗余信息就是信息熵:
Shannon 在 1948 年发表的论文“通信的数学理论( A Mathematical Theory of Communication )”中, Shannon 指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息量称为“信息熵”。
Codec的价值就是尽可能找到视频中的冗余信息,并将其压缩。当然,Codec还可以有损压缩,找到画质和比特率的平衡点。如今,全球最顶尖的科学家仍然在为之奋斗。关于数据压缩的极限与信息熵的关系,可参考阮一峰的blog:
http://www.ruanyifeng.com/blog/2014/09/information-entropy.html
Google I/O和微软Bulid上,展示了大量的AI赋能的产品与服务,人工智能的时代已经到来,而且还刚刚开始。相比而言,Codec这样略显枯燥无趣的技术并没有基于足够的关注。
比如,YouTube通过优化策略提升用户体验的同时节省了14%带宽 ,Facebook使用AV1让编码效率比x264、VP9提升了30%,这些收益往往不易察觉,但却真实可观。
在今天凌晨的Google I/O大会上,Zoe Liu在“Build awesome media experiences on the web”专题中,代表Google面向全球开发者介绍了AV1的背景技术以及应用前景。AV1是AOM联盟推出的第一个Codec。AV1开源并且免专利费,是开放、共享的互联网精神下的产物。
本文分享自 LiveVideoStack 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!