使用libavcodec将mp3音频文件解码为pcm音频采样数据【[mp3float @ 0x561c1ec49940] Header missing】

V2AS问路

使用libavcodec将mp3音频文件解码为pcm音频采样数据【[mp3float @ 0x561c1ec49940] Header missing】

阅读原文时间：2023年08月21日阅读：3

一.打开和关闭输入文件和输出文件

　　想要解决上面提到的问题，我们需要对mp3文件的格式有个大致了解，为了方便讲解，我这里画了个示意图：

ID3V2

包含了作者，作曲，专辑等信息，长度不固定，扩展了 ID3V1 的信息量。

Frame

一系列的帧，个数由文件大小和帧长决定

ID3V1

包含了作者，作曲，专辑等信息，长度为 128BYTE

　　由于av_parser_parse2()这个方法的输入必须是只包含音频编码数据的“裸流”，所以，我们在读取mp3文件的时候，必须跳过ID3V2标签部分，从Frame开始。所以，我们就必须知道ID3V2标签的总长度。下面，我画了个ID3V2标签头的示意图，方便讲解。

File ID(3)

Version(2)

Flags(1)

Size(4)

　　ID3V2标签头固定为10byte，其中，Size部分的值是指除ID3V2标签头之外数据的总长度。需要注意的是，在实际计算长度的时候，这4个字节的最高位需要舍弃，也就是说，只用到了28bit，即：0xxxxxxx0xxxxxxx0xxxxxxx0xxxxxxx

#define AUDIO_INBUF_SIZE 20480
#define AUDIO_REFILL_THRESH 4096
static FILE* input_file= nullptr;
static FILE* output_file= nullptr;
static const AVCodec* codec= nullptr;
static AVCodecContext* codec_ctx= nullptr;
static AVPacket* pkt= nullptr;
static AVFrame* frame= nullptr;
static AVCodecParserContext* parser= nullptr;
static enum AVCodecID audio_codec_id;

void close_input_output_files(){
if(input_file!= nullptr){
fclose(input_file);
input_file= nullptr;
}
if(output_file!= nullptr){
fclose(output_file);
output_file= nullptr;
}
}

int32_t open_input_output_files(const char* input_name,const char* output_name){
if(strlen(input_name)==0||strlen(output_name)==0){
cout<<"Error:empty input or output file name."<<endl;
return -1;
}
close_input_output_files();
input_file=fopen(input_name,"rb");//rb：读取一个二进制文件，该文件必须存在
if(input_file==nullptr){
cerr<<"Error:failed to open input file."<<endl;
return -1;
}
output_file=fopen(output_name,"wb");//wb:打开或新建一个二进制文件，只允许写
if(output_file== nullptr){
cout<<"Error:failed to open output file."<<endl;
return -1;
}
uint8_t ID3V2_Header[10];
fread(ID3V2_Header,10,1,input_file);
long ID3V2_Size=((ID3V2_Header[6]&0x7f)<<21)+((ID3V2_Header[7]&0x7f)<<14)+((ID3V2_Header[8]&0x7f)<<7)+(ID3V2_Header[9]&0x7f)+10;
fseek(input_file,ID3V2_Size,SEEK_SET);
return 0;
}

二.音频解码器的初始化以及销毁

int32_t init_audio_decoder(const char* audio_codec){
if(strcasecmp(audio_codec,"MP3")==0){
audio_codec_id=AV_CODEC_ID_MP3;
cout<<"Select codec id:MP3"<id);
if(!parser){
cerr<<"Error:could not init parser."<<endl;
return -1;
}
codec_ctx= avcodec_alloc_context3(codec);
if(!codec_ctx){
cerr<<"Error:could not alloc codec_ctx."<<endl;
return -1;
}
int32_t result=avcodec_open2(codec_ctx,codec, nullptr);
if(result<0){
cerr<<"Error:could not open codec."<<endl;
return -1;
}
frame=av_frame_alloc();
if(!frame){
cerr<<"Error:could not alloc frame."<<endl;
return -1;
}
pkt=av_packet_alloc();
if(!pkt){
cerr<<"Error:could not alloc packet."<<endl;
return -1;
}
return 0;
}
void destroy_audio_decoder(){
av_parser_close(parser);
avcodec_free_context(&codec_ctx);
av_frame_free(&frame);
av_packet_free(&pkt);
}

三.解码循环体

　　解码循环体至少需要实现以下三个功能：

　　　　1.从输入源中循环获取码流包

　　　　2.将当前帧传入解码器，获取输出的音频采样数据

　　　　3.输出解码获取的音频采样数据到输出文件

　　从输入源中读取音频数据到缓存：　

int32_t read_data_to_buf(uint8_t* buf,int32_t size,int32_t& out_size){
int32_t read_size=fread(buf,1,size,input_file);
if(read_size==0){
cerr<<"Error:read_data_to_buf failed."<<endl;
return -1;
}
out_size=read_size;
return 0;
}

　　解码循环体：　　

int32_t end_of_input_file(){
return feof(input_file);
}
static int32_t decode_packet(bool flushing){
int32_t result=0;
result= avcodec_send_packet(codec_ctx,flushing? nullptr:pkt);
if(result<0){ cerr<<"Error:avcodec_send_packet failed,result:"<=0){
result= avcodec_receive_frame(codec_ctx,frame);
if(result==AVERROR(EAGAIN)||result==AVERROR_EOF){
return 1;
}
else if(result<0){ cerr<<"Error:avcodec_receive_frame failed."<nb_samples:"<nb_samples<<",frame->channels:"<channels<0){
result=av_parser_parse2(parser,codec_ctx,&pkt->data,&pkt->size,data,data_size,AV_NOPTS_VALUE,AV_NOPTS_VALUE,0);
if(result<0){ cerr<<"Error:av_parser_parse2 failed."<size){
cout<<"Parsed packet size:"<size< 0)
data_size += len;
}
}
}
decode_packet(true);
return 0;
}

　　输出解码的音频采样数据：　　

int32_t write_samples_to_pcm(AVFrame* frame,AVCodecContext* codec_ctx){
int data_size= av_get_bytes_per_sample(codec_ctx->sample_fmt);
if(data_size<0){ cerr<<"Error:failed to calculate data size."<nb_samples;i++){
for(int ch=0;chchannels;ch++){
fwrite(frame->data[ch]+i*data_size,1,data_size,output_file);
}
}
return 0;
}

　　最终，main函数的实现如下：

int main(){
const char* input_file_name="../input.mp3";
const char* output_file_name="../output.pcm";
const char* codec_name="MP3";
int32_t result= open_input_output_files(input_file_name,output_file_name);
if(result<0){
return result;
}
result=init_audio_decoder(codec_name);
if(result<0){
return result;
}
result=audio_decoding();
if(result<0){
return result;
}
destroy_audio_decoder();
close_input_output_files();
return 0;
}

　　解码完成后，可以使用ffplay播放output.pcm文件：

　　ffplay -ar 44100 -ac 2 -f f32le -i output.pcm

手机扫一扫

移动阅读更方便

你可能感兴趣的文章

如何使用libavcodec将.h264码流文件解码为.yuv图像序列？

如何使用libavcodec将.yuv图像序列编码为.h264的视频码流？

如何将PCM格式的原始音频采样数据编码为MP3格式或AAC格式的音频文件？

[语音识别] 基于Python构建简易的音频录制与语音识别应用

如何将mp4文件解复用并且解码为单独的.yuv图像序列以及.pcm音频采样数据？

认识Dubbo与RPC