解密H264、AAC硬件解码的关键扩展数据处理

通过上一篇文章,我们用ffmpeg分离出一个多媒体容器中的音视频数据,但是很可能这些数据是不能被正确解码的。为什么呢?因为在解码这些数据之前,需要对解码器做一些配置,典型的就是目前流行的高清编码“黄金搭档”组合H264 + AAC的搭配。本文将讲述H264和AAC的关键解码配置参数的解析,如果没有这些配置信息,数据帧往往不完整,导致了解码器不能解码。

  • H264的配置信息解析 前面我们知道,ffmpeg的avformat_find_stream_info函数可以取得音视频媒体多种,比如播放持续时间、音视频压缩格式、音轨信息、字幕信息、帧率、采样率等。在信息结果中有一项扩展数据描述(avcodec.h文件中):

AVCodecContext定义如下:

如果视频流是H264,这个extradate里面就包含了H264的配置信息,这个扩展数据有如下定义:

详细解释可以参考“ISO-14496-15AVC file format”文档。里面最重要的就是NAL长度和SPS,PPS数据和对应的长度信息。对该数据的解析在ffmpeg里面有现成的函数:ff_h264_decode_extradata,在我的项目里面是自己写的扩展数据解析。

  • AAC的配置信息解析及设置 如果音频数据是AAC流,在解码时需要ADTS(Audio Data Transport Stream)头部,不管是容器封装还是流媒体,没有这个,一般都是不能播放的。很多朋友在做AAC流播放时遇到播不出声音,很可能就是这个原因导致。 ADTS所需的数据仍然是放在上面的扩展数据extradata中,我们需要先解码这个扩展数据,然后再从解码后的数据信息里面重新封装成ADTS头信息,加到每一帧AAC数据之前再送解码器,这样就可以正常解码了。 extradate数据定义如下:

详细信息及说明请参考“ISO-IEC-14496-3 (Audio)”的AudioSpecificConfig部分。里面最重要的部分有采样频率、通道配置和音频对象类型,这几个一般都是AAC解码器需要的配置参数。 这个数据在ffmpeg中也有相应的解码函数:avpriv_aac_parse_header。在我的项目中,我没有使用这个函数,而是自己实现的: typedefstruct { int write_adts; int objecttype; int sample_rate_index; int channel_conf; }ADTSContext; intaac_decode_extradata(ADTSContext *adts, unsigned char *pbuf, int bufsize) { int aot, aotext, samfreindex; int i, channelconfig; unsigned char *p = pbuf; if (!adts || !pbuf || bufsize<2) { return -1; } aot = (p[0]>>3)&0x1f; if (aot == 31) { aotext = (p[0]<<3 |(p[1]>>5))&0x3f; aot = 32 + aotext; samfreindex =(p[1]>>1)&0x0f; if (samfreindex == 0x0f) { channelconfig =((p[4]<<3)|(p[5]>>5))&0x0f; } else { channelconfig =((p[1]<<3)|(p[2]>>5))&0x0f; } } else { samfreindex =((p[0]<<1)|p[1]>>7)&0x0f; if (samfreindex == 0x0f) { channelconfig = (p[4]>>3)&0x0f; } else { channelconfig =(p[1]>>3)&0x0f; } } #ifdefAOT_PROFILE_CTRL if (aot < 2) aot = 2; #endif adts->objecttype = aot-1; adts->sample_rate_index = samfreindex; adts->channel_conf = channelconfig; adts->write_adts = 1; return 0; }

上面的pbuf就是extradata。

接下来,再用ADTSContext数据编码为ADTS头信息插入每一个AAC帧前面:

intaac_set_adts_head(ADTSContext *acfg, unsigned char *buf, int size)

{

unsigned char byte;

if (size < ADTS_HEADER_SIZE)

{

return -1;

}

buf[0] = 0xff;

buf[1] = 0xf1;

byte = 0;

byte |=(acfg->objecttype&0x03)<<6;

byte |= (acfg->sample_rate_index&0x0f)<<2;

byte |= (acfg->channel_conf&0x07)>> 2;

buf[2] = byte;

byte = 0;

byte |= (acfg->channel_conf&0x07)<<6;

byte |= (ADTS_HEADER_SIZE +size)>>11;

buf[3] = byte;

byte = 0;

byte |= (ADTS_HEADER_SIZE +size)>>3;

buf[4] = byte;

byte = 0;

byte |= ((ADTS_HEADER_SIZE +size)&0x7)<<5;

byte |= (0x7ff >>6)&0x1f;

buf[5] = byte;

byte = 0;

byte |= (0x7ff&0x3f)<<2;

buf[6] = byte;

return 0;

}

这个头部是固定的7字节长度,所以可提前空出这7个字节供ADTS占用。

通过以上对H264和AAC的扩展数据处理,播放各种“黄金搭档”的多媒体文件、流媒体、视频点播等都应该没有问题了。

原文发布于微信公众号 - 程序员互动联盟(coder_online)

原文发表时间:2015-04-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信技能树

用GenePred注释文件进行数据分析

编者注:前几天在生信技能树我们发现了一个神奇的帖子(http://www.biotrainee.com/thread-928-1-1.html ), 作者用一种...

58714
来自专栏NetCore

复杂而艰辛的重构之路--起步

你有没有试过,当你踏入一个新的公司,看到了几千几万几十万代码的时候,那种崩溃的感觉? 代码多不可怕,怕的是代码的可读性、维护性、扩展性是如此之差,这时候该怎么办...

2149
来自专栏彭湖湾的编程世界

【计算机网络】 网络体系结构分类: 客户机/服务器体系和P2P

网络体系结构的分类 现代网络应用程序有两种主流的体系结构: 客户机/服务器体系结构和P2P体系结构(peer to peer “对等”) 一 . 客户机/服务器...

29110
来自专栏java一日一条

Java Fork/Join 框架

响应式编程(Reactive Programming / RP)作为一种范式在整个业界正在逐步受到认可和落地,是对过往系统的业务需求理解梳理之后对系统技术设计/...

2621
来自专栏牛客网

C++后台腾讯WXG实习面经(已拿offer)

2105
来自专栏王亚昌的专栏

Way to Go

Go is designed from first principles to advance the practice of software enginee...

862
来自专栏牛客网

字节跳动Android工程师秋招面筋

一切都明明白白,但我们仍匆匆错过,因为你相信命运,因为我怀疑生活。——顾城 《错过》

3872
来自专栏牛客网

C++后台实习面经 - 腾讯WXG

拿到题目之后没有任何思考,想用中序遍历然后把遍历结果放到一个容量为k的队列中(基本操作)。但是为什么顺手就写下vector???面试官看见我这么快下笔之后看了看...

1974
来自专栏更流畅、简洁的软件开发方式

面向对象最重要的是“抽象”,三层最重要的也是“抽象”,没有抽象就不是真正的面向对象、三层。

  只用class的,那叫做“基于对象”,比如当初的vb6.0;只是分了三个项目,把以前写在一起的代码分成了三份,所谓的业务逻辑层就是一个传声筒,这一类自称三层...

2926
来自专栏向治洪

Java中的ReentrantLock和synchronized两种锁机制的对比

原文:http://www.ibm.com/developerworks/cn/java/j-jtp10264/index.html 多线程和并发性并不是什...

2415

扫码关注云+社区

领取腾讯云代金券