我是一名初级工程师,从事计算机视觉的研究和工作。越来越多的我发现,我陷入困境或被困在项目,因为我没有足够的低层次的视频格式知识。我指的是编解码器、容器、压缩、颜色格式、传输协议等。例如PAL、NTCS、DVB-T、YUV、YCbCr、H.264、MPEG、交织、渐进扫描等。例如,我很想通过浏览视频帧就能找到像这这样的答案。
在我看来,这是一个很难突破的知识领域。对于计算机图形学,有OpenGL超级圣经,AI有Russel和Norvig;有权威的入门书或这个行业的人可以推荐的知识来源吗?理想的是包含编程示例的东西(例如如何手动实现H.264解码例程?)在接下来的五年里,我不知道如何扩展我在这方面的知识。
发布于 2013-11-28 02:44:29
就我所知没有。我花了很多时间阅读官方规范(现在已经超过5年了)。讽刺的是,我一直在考虑写这座坟墓。我只是不确定市场的潜力。
不过,我可以指出一些我最喜欢的资源:
首先是ITU的出版物.这些是官方的标准。http://www.itu.int/en/ITU-T/publications/Pages/default.aspx
我似乎经常提到这本书视频神秘感。对于基本的编解码器介绍,我喜欢C/C++中的视频压缩介绍。我认为xiph.org的视频真的很棒。
发布于 2013-11-28 04:45:11
几年前,我写了一个叫做多媒体技术基础的基本介绍。至少,这应该有助于您的YUV/YCbCr格式识别。
你想学什么取决于你到底想(或需要)完成什么。你需要写编码器还是解码器?实现H.264解码器并不是一个简单的,甚至是一个中间的多媒体任务--我怀疑你是否想要这样做,除非你真的对解码算法背后的低层次细节感到好奇(我绝对是--见我的处理)。一个更温和的方式来达到编程多媒体压缩方案的速度将是解决JPEG解码器。下面是我写的一篇博文:用JPEG解码器学习多媒体编程
有大量的文献和视频可以直接深入到多媒体的核心数学细节中,但我不赞成这种方法(因为它往往会吓跑很多人)。所以小心点。不要害怕在这里发布关于更精细的视频和多媒体主题的更具体的问题。
https://stackoverflow.com/questions/20255895
复制相似问题