深圳哪家语音识别系统方案商品质过硬？

语音识别常用声学特征：
1、线性预测系数lpc
线性预测分析从人的发声机理入手，通过对声道的短管级联模型的研究，认为系统的传递函数符合全极点数字滤波器的形式，从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小lms，即可得到线性预测系数lpc。对 lpc的计算方法有自相关法（德宾durbin法）、协方差法、格型法等等。计算上的快，速有效保证了这一声学特征的广泛使用。与lpc这种预测参数模型类似的声学特征还有线谱对lsp、反射系数等等。
2、mel倒谱系数mfcc和感知线性预测plp
不同于lpc等通过对人的发声机理的研究而得到的声学特征，mel倒谱系数mfcc和感知线性预测 plp是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现，当两个频率相近的音调同时发出时，人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界，当两个音调的频率差小于临界带宽时，人就会把两个音调听成一个，这称之为屏蔽效应。mel刻度是对这一临界带宽的度量方法之一。
3、倒谱系数cep
利用同态处理方法，对语音信号求离散傅立叶变换dft后取对数，再求反变换idft就可得到倒谱系数。对lpc倒谱（lpccep），在获得滤波器的线性预测系数后，可以用一个递推公式计算得出。实验表明，使用倒谱可以提高特征参数的稳定性。

深圳旭源亿科技公司
400 0755 908

深圳哪家语音识别系统方案商品质过硬？

VIP推荐