打算记录一下基于ffmpeg的封装格式处理方面的例子。包括了视音频分离,复用,封装格式转换。这是第3篇。
本文记录一个基于ffmpeg的视音频复用器(simplest ffmpeg muxer)。视音频复用器(muxer)即是将视频压缩数据(例如h.264)和音频压缩数据(例如aac)合并到一个封装格式数据(例如mkv)中去。如图所示。在这个过程中并不涉及到编码和解码。
本文记录的程序将一个h.264编码的视频码流文件和一个mp3编码的音频码流文件,合成为一个mp4封装格式的文件。
,一共初始化了3个avformatcontext,其中2个用于输入,1个用于输出。3个avformatcontext初始化之后,通过avcodec_copy_context()函数可以将输入视频/音频的参数拷贝至输出视频/音频的avcodeccontext结构体。然后分别调用视频输入流和音频输入流的av_read_frame(),从视频输入流中取出视频的avpacket,音频输入流中取出音频的avpacket,分别将取出的avpacket写入到输出文件中即可。其间用到了一个不太常见的函数av_compare_ts(),是比较时间戳用的。通过该函数可以决定该写入视频还是音频。
本文介绍的视音频复用器,输入的视频不一定是h.264裸流文件,音频也不一定是纯音频文件。可以选择两个封装过的视音频文件作为输入。程序会从视频输入文件中“挑”出视频流,音频输入文件中“挑”出音频流,再将“挑选”出来的视音频流复用起来。 ps1:对于某些封装格式(例如mp4/flv/mkv等)中的h.264,需要用到名称为“h264_mp4toannexb”的bitstream filter。
ps2:对于某些封装格式(例如mp4/flv/mkv等)中的aac,需要用到名称为“aac_adtstoasc”的bitstream filter。
简单介绍一下流程中各个重要函数的意义:
avformat_open_input():打开输入文件。
avcodec_copy_context():赋值avcodeccontext的参数。
avformat_alloc_output_context2():初始化输出文件。
avio_open():打开输出文件。
avformat_write_header():写入文件头。
av_compare_ts():比较时间戳,决定写入视频还是写入音频。这个函数相对要少见一些。
av_read_frame():从输入文件读取一个avpacket。
av_interleaved_write_frame():写入一个avpacket到输出文件。
av_write_trailer():写入文件尾。
代码下面贴上代码:[cpp] view plaincopy
/**
* 最简单的基于ffmpeg的视音频复用器
* simplest ffmpeg muxer
*
* 雷霄骅 lei xiaohua
* leixiaohua1020@126.com
* 中国传媒大学/数字电视技术
* communication university of china / digital tv technology
* http://blog.csdn.net/leixiaohua1020
*
* 本程序可以将视频码流和音频码流打包到一种封装格式中。
* 程序中将mp3编码的音频码流和h.264编码(mpeg2ts封装中)的视频码流打包成
* mp4封装格式的文件。
* 需要注意的是本程序并不改变视音频的编码格式。
*
* this software mux a video bitstream and a audio bitstream
* together into a file.
* in this example, it mux a h.264 bitstream (in mpeg2ts) and
* a mp3 bitstream file together into mp4 format file.
*
*/
#include
extern c
{
#include libavformat/avformat.h
};
/*
fix: h.264 in some container format (flv, mp4, mkv etc.) need
h264_mp4toannexb bitstream filter (bsf)
*add sps,pps in front of idr frame
*add start code (0,0,0,1) in front of nalu
h.264 in some container (mpeg2ts) don't need this bsf.
*/
//'1': use h.264 bitstream filter
#define use_h264bsf 0
/*
fix:aac in some container format (flv, mp4, mkv etc.) need
aac_adtstoasc bitstream filter (bsf)
*/
//'1': use aac bitstream filter
#define use_aacbsf 0
int main(int argc, char* argv[])
{
avoutputformat *ofmt = null;
//输入对应一个avformatcontext,输出对应一个avformatcontext
//(input avformatcontext and output avformatcontext)
avformatcontext *ifmt_ctx_v = null, *ifmt_ctx_a = null,*ofmt_ctx = null;
avpacket pkt;
int ret, i;
char *in_filename_v = cuc_ieschool.ts;//输入文件名(input file url)
//char *in_filename_v = cuc_ieschool.h264;
//char *in_filename_a = cuc_ieschool.mp3;
//char *in_filename_a = gowest.m4a;
//char *in_filename_a = gowest.aac;
char *in_filename_a = huoyuanjia.mp3;
char *out_filename = cuc_ieschool.mp4;//输出文件名(output file url)
av_register_all();
//输入(input)
if ((ret = avformat_open_input(&ifmt_ctx_v, in_filename_v, 0, 0))
printf( could not open input file.);
goto end;
}
if ((ret = avformat_find_stream_info(ifmt_ctx_v, 0))
printf( failed to retrieve input stream information);
goto end;
}
if ((ret = avformat_open_input(&ifmt_ctx_a, in_filename_a, 0, 0))
printf( could not open input file.);
goto end;
}
if ((ret = avformat_find_stream_info(ifmt_ctx_a, 0))
printf( failed to retrieve input stream information);
goto end;
}
printf(input information=====================\n);
av_dump_format(ifmt_ctx_v, 0, in_filename_v, 0);
av_dump_format(ifmt_ctx_a, 0, in_filename_a, 0);
printf(======================================\n);
//输出(output)
avformat_alloc_output_context2(&ofmt_ctx, null, null, out_filename);
if (!ofmt_ctx) {
printf( could not create output context\n);
ret = averror_unknown;
goto end;
}
ofmt = ofmt_ctx->oformat;
int videoindex_v=-1,videoindex_out=-1;
for (i = 0; i nb_streams; i++) {
//根据输入流创建输出流(create output avstream according to input avstream)
if(ifmt_ctx_v->streams[i]->codec->codec_type==avmedia_type_video){
videoindex_v=i;
avstream *in_stream = ifmt_ctx_v->streams[i];
avstream *out_stream = avformat_new_stream(ofmt_ctx, in_stream->codec->codec);
if (!out_stream) {
printf( failed allocating output stream\n);
ret = averror_unknown;
goto end;
}
videoindex_out=out_stream->index;
//复制avcodeccontext的设置(copy the settings of avcodeccontext)
if (avcodec_copy_context(out_stream->codec, in_stream->codec)
printf( failed to copy context from input to output stream codec context\n);
goto end;
}
out_stream->codec->codec_tag = 0;
if (ofmt_ctx->oformat->flags & avfmt_globalheader)
out_stream->codec->flags |= codec_flag_global_header;
break;
}
}
int audioindex_a=-1,audioindex_out=-1;
for (i = 0; i nb_streams; i++) {
//根据输入流创建输出流(create output avstream according to input avstream)
if(ifmt_ctx_a->streams[i]->codec->codec_type==avmedia_type_audio){
audioindex_a=i;
avstream *in_stream = ifmt_ctx_a->streams[i];
avstream *out_stream = avformat_new_stream(ofmt_ctx, in_stream->codec->codec);
if (!out_stream) {
printf( failed allocating output stream\n);
ret = averror_unknown;
goto end;
}
audioindex_out=out_stream->index;
//复制avcodeccontext的设置(copy the settings of avcodeccontext)
if (avcodec_copy_context(out_stream->codec, in_stream->codec)
printf( failed to copy context from input to output stream codec context\n);
goto end;
}
out_stream->codec->codec_tag = 0;
if (ofmt_ctx->oformat->flags & avfmt_globalheader)
out_stream->codec->flags |= codec_flag_global_header;
break;
}
}
//输出一下格式------------------
printf(output information====================\n);
av_dump_format(ofmt_ctx, 0, out_filename, 1);
printf(======================================\n);
//打开输出文件(open output file)
if (!(ofmt->flags & avfmt_nofile)) {
if (avio_open(&ofmt_ctx->pb, out_filename, avio_flag_write)
printf( could not open output file '%s', out_filename);
goto end;
}
}
//写文件头(write file header)
if (avformat_write_header(ofmt_ctx, null)
printf( error occurred when opening output file\n);
goto end;
}
int frame_index=0;
int64_t cur_pts_v=0,cur_pts_a=0;
//fix
#if use_h264bsf
avbitstreamfiltercontext* h264bsfc = av_bitstream_filter_init(h264_mp4toannexb);
#endif
#if use_aacbsf
avbitstreamfiltercontext* aacbsfc = av_bitstream_filter_init(aac_adtstoasc);
#endif
while (1) {
avformatcontext *ifmt_ctx;
int stream_index=0;
avstream *in_stream, *out_stream;
//获取一个avpacket(get an avpacket)
if(av_compare_ts(cur_pts_v,ifmt_ctx_v->streams[videoindex_v]->time_base,cur_pts_a,ifmt_ctx_a->streams[audioindex_a]->time_base)
ifmt_ctx=ifmt_ctx_v;
stream_index=videoindex_out;
if(av_read_frame(ifmt_ctx, &pkt) >= 0){
do{
if(pkt.stream_index==videoindex_v){
cur_pts_v=pkt.pts;
break;
}
}while(av_read_frame(ifmt_ctx, &pkt) >= 0);
}else{
break;
}
}else{
ifmt_ctx=ifmt_ctx_a;
stream_index=audioindex_out;
if(av_read_frame(ifmt_ctx, &pkt) >= 0){
do{
if(pkt.stream_index==audioindex_a){
cur_pts_a=pkt.pts;
break;
}
}while(av_read_frame(ifmt_ctx, &pkt) >= 0);
}else{
break;
}
}
in_stream = ifmt_ctx->streams[pkt.stream_index];
out_stream = ofmt_ctx->streams[stream_index];
//fix
#if use_h264bsf
av_bitstream_filter_filter(h264bsfc, in_stream->codec, null, &pkt.data, &pkt.size, pkt.data, pkt.size, 0);
#endif
#if use_aacbsf
av_bitstream_filter_filter(aacbsfc, in_stream->codec, null, &pkt.data, &pkt.size, pkt.data, pkt.size, 0);
#endif
//fix:no pts (example: raw h.264)
//simple write pts
if(pkt.pts==av_nopts_value){
//write pts
avrational time_base1=in_stream->time_base;
//duration between 2 frames (us)
int64_t calc_duration=(double)av_time_base/av_q2d(in_stream->r_frame_rate);
//parameters
pkt.pts=(double)(frame_index*calc_duration)/(double)(av_q2d(time_base1)*av_time_base);
pkt.dts=pkt.pts;
pkt.duration=(double)calc_duration/(double)(av_q2d(time_base1)*av_time_base);
frame_index++;
}
/* copy packet */
//转换pts/dts(convert pts/dts)
pkt.pts = av_rescale_q_rnd(pkt.pts, in_stream->time_base, out_stream->time_base, (avrounding)(av_round_near_inf|av_round_pass_minmax));
pkt.dts = av_rescale_q_rnd(pkt.dts, in_stream->time_base, out_stream->time_base, (avrounding)(av_round_near_inf|av_round_pass_minmax));
pkt.duration = av_rescale_q(pkt.duration, in_stream->time_base, out_stream->time_base);
pkt.pos = -1;
pkt.stream_index=stream_index;
printf(write 1 packet. size:%5d\tpts:%8d\n,pkt.size,pkt.pts);
//写入(write)
if (av_interleaved_write_frame(ofmt_ctx, &pkt)
printf( error muxing packet\n);
break;
}
av_free_packet(&pkt);
}
//写文件尾(write file trailer)
av_write_trailer(ofmt_ctx);
#if use_h264bsf
av_bitstream_filter_close(h264bsfc);
#endif
#if use_aacbsf
av_bitstream_filter_close(aacbsfc);
#endif
end:
avformat_close_input(&ifmt_ctx_v);
avformat_close_input(&ifmt_ctx_a);
/* close output */
if (ofmt_ctx && !(ofmt->flags & avfmt_nofile))
avio_close(ofmt_ctx->pb);
avformat_free_context(ofmt_ctx);
if (ret
printf( error occurred.\n);
return -1;
}
return 0;
