解密H264、AAC硬件解码的关键扩展数据处理

通过上一篇文章,我们用ffmpeg分离出一个多媒体容器中的音视频数据,但是很可能这些数据是不能被正确解码的。为什么呢?因为在解码这些数据之前,需要对解码器做一些配置,典型的就是目前流行的高清编码“黄金搭档”组合H264 + AAC的搭配。本文将讲述H264和AAC的关键解码配置参数的解析,如果没有这些配置信息,数据帧往往不完整,导致了解码器不能解码。

  • H264的配置信息解析 前面我们知道,ffmpeg的avformat_find_stream_info函数可以取得音视频媒体多种,比如播放持续时间、音视频压缩格式、音轨信息、字幕信息、帧率、采样率等。在信息结果中有一项扩展数据描述(avcodec.h文件中):

AVCodecContext定义如下:

如果视频流是H264,这个extradate里面就包含了H264的配置信息,这个扩展数据有如下定义:

详细解释可以参考“ISO-14496-15AVC file format”文档。里面最重要的就是NAL长度和SPS,PPS数据和对应的长度信息。对该数据的解析在ffmpeg里面有现成的函数:ff_h264_decode_extradata,在我的项目里面是自己写的扩展数据解析。

  • AAC的配置信息解析及设置 如果音频数据是AAC流,在解码时需要ADTS(Audio Data Transport Stream)头部,不管是容器封装还是流媒体,没有这个,一般都是不能播放的。很多朋友在做AAC流播放时遇到播不出声音,很可能就是这个原因导致。 ADTS所需的数据仍然是放在上面的扩展数据extradata中,我们需要先解码这个扩展数据,然后再从解码后的数据信息里面重新封装成ADTS头信息,加到每一帧AAC数据之前再送解码器,这样就可以正常解码了。 extradate数据定义如下:

详细信息及说明请参考“ISO-IEC-14496-3 (Audio)”的AudioSpecificConfig部分。里面最重要的部分有采样频率、通道配置和音频对象类型,这几个一般都是AAC解码器需要的配置参数。 这个数据在ffmpeg中也有相应的解码函数:avpriv_aac_parse_header。在我的项目中,我没有使用这个函数,而是自己实现的: typedefstruct { int write_adts; int objecttype; int sample_rate_index; int channel_conf; }ADTSContext; intaac_decode_extradata(ADTSContext *adts, unsigned char *pbuf, int bufsize) { int aot, aotext, samfreindex; int i, channelconfig; unsigned char *p = pbuf; if (!adts || !pbuf || bufsize<2) { return -1; } aot = (p[0]>>3)&0x1f; if (aot == 31) { aotext = (p[0]<<3 |(p[1]>>5))&0x3f; aot = 32 + aotext; samfreindex =(p[1]>>1)&0x0f; if (samfreindex == 0x0f) { channelconfig =((p[4]<<3)|(p[5]>>5))&0x0f; } else { channelconfig =((p[1]<<3)|(p[2]>>5))&0x0f; } } else { samfreindex =((p[0]<<1)|p[1]>>7)&0x0f; if (samfreindex == 0x0f) { channelconfig = (p[4]>>3)&0x0f; } else { channelconfig =(p[1]>>3)&0x0f; } } #ifdefAOT_PROFILE_CTRL if (aot < 2) aot = 2; #endif adts->objecttype = aot-1; adts->sample_rate_index = samfreindex; adts->channel_conf = channelconfig; adts->write_adts = 1; return 0; }

上面的pbuf就是extradata。

接下来,再用ADTSContext数据编码为ADTS头信息插入每一个AAC帧前面:

intaac_set_adts_head(ADTSContext *acfg, unsigned char *buf, int size)

{

unsigned char byte;

if (size < ADTS_HEADER_SIZE)

{

return -1;

}

buf[0] = 0xff;

buf[1] = 0xf1;

byte = 0;

byte |=(acfg->objecttype&0x03)<<6;

byte |= (acfg->sample_rate_index&0x0f)<<2;

byte |= (acfg->channel_conf&0x07)>> 2;

buf[2] = byte;

byte = 0;

byte |= (acfg->channel_conf&0x07)<<6;

byte |= (ADTS_HEADER_SIZE +size)>>11;

buf[3] = byte;

byte = 0;

byte |= (ADTS_HEADER_SIZE +size)>>3;

buf[4] = byte;

byte = 0;

byte |= ((ADTS_HEADER_SIZE +size)&0x7)<<5;

byte |= (0x7ff >>6)&0x1f;

buf[5] = byte;

byte = 0;

byte |= (0x7ff&0x3f)<<2;

buf[6] = byte;

return 0;

}

这个头部是固定的7字节长度,所以可提前空出这7个字节供ADTS占用。

通过以上对H264和AAC的扩展数据处理,播放各种“黄金搭档”的多媒体文件、流媒体、视频点播等都应该没有问题了。

原文发布于微信公众号 - 程序员互动联盟(coder_online)

原文发表时间:2015-04-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏C语言C++游戏编程

C语言讨论象棋将帅问题,代码短又美!

问题的本身并不复杂,只要把所有A、B 互相排斥的条件列举出来就可以完成本题的要 求。由于本题要求只能使用一个变量,所以必须首先想清楚在写代码的时候,有哪些信息需...

583
来自专栏竹清助手

深入理解 Laravel Eloquent(三)——模型间关系(关联)

Eloquent 是一个 ORM,全称为 Object Relational Mapping,翻译为 “对象关系映射”(如果只把它当成 Database A...

653
来自专栏Python入门

你还在为Python中文乱码而感到烦恼?今天老司机给你讲讲!

有没有遇到过这样的问题,读取文件被提示“UnicodeDecodeError”、爬取网页得到一堆乱码,其实这些都是编码惹的祸,如果不能真正理解编码的问题所在,就...

973
来自专栏叁金大数据

自学Python一 迷茫中的开端!

  有心学习一下Python,多门技术多条路啊。经历了找教程,看代码,写demo,这东西入门容易精通难啊!又因为请了两周婚假彻底忘光光。想了想自己还是边复习边写...

762
来自专栏程序你好

幽默的程序员:10 个有趣的程序员笑话

642
来自专栏用户2442861的专栏

Markdown,你只需要掌握这几个

http://www.cnblogs.com/crazyant007/p/4220066.html

281
来自专栏前端架构与工程

《微信小程序七日谈》- 第三天:玩转Page组件的生命周期

《微信小程序七日谈》系列文章: 本系列的文章并非初学教程,而是笔者在具体开发过程中遇到的问题以及部分解决方案。 前两篇文章第一天:人生若只如初见和第二天:你可...

19010
来自专栏Crossin的编程教室

真值表

逻辑判断是编程中极为常用的知识。之前的课我们已经说过,见第6课和第11课。但鉴于逻辑运算的重要性,今天我再把常用的运算结果总结一下,供大家参考。 这种被称为“真...

2064
来自专栏Crossin的编程教室

【Python 第26课】 操作list

上周给list开了个头,知道了什么是list。假设我们现在有一个list: l = [365, 'everyday', 0.618, True] 除了用for...

34111
来自专栏大前端开发

从编程小白到全栈开发:操控浏览器

一个程序猿和普通电脑用户,当他们浏览到一个效果炫酷的网页的时候,他们的反应是不太相同的:

523

扫描关注云+社区