MFCC的计算过程包括加窗、快速傅里叶变换(FFT)、Mel滤波器组处理以及离散余弦变换(DCT)
预加重:在进行特征提取之前,通常会对音频信号进行预加重处理,以增强高频部分的能量,这有助于提高语音信号的分辨率。分帧和加窗:将音频信号分成多个短时帧,并对每一帧应用窗函数(如汉明窗或海宁窗),以减少频谱泄漏并平滑边缘。快速傅里叶变换(FFT):对加窗后的每一帧
预加重:在进行特征提取之前,通常会对音频信号进行预加重处理,以增强高频部分的能量,这有助于提高语音信号的分辨率。分帧和加窗:将音频信号分成多个短时帧,并对每一帧应用窗函数(如汉明窗或海宁窗),以减少频谱泄漏并平滑边缘。快速傅里叶变换(FFT):对加窗后的每一帧