您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

深圳哪家语音识别系统方案商品质过硬?

2018/8/13 7:54:34发布85次查看
 语音识别常用声学特征:
1、线性预测系数lpc
线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小lms,即可得到线性预测系数lpc。对 lpc的计算方法有自相关法(德宾durbin法)、协方差法、格型法等等。计算上的快,速有效保证了这一声学特征的广泛使用。与lpc这种预测参数模型类似的声学特征还有线谱对lsp、反射系数等等。
2、mel倒谱系数mfcc和感知线性预测plp
不同于lpc等通过对人的发声机理的研究而得到的声学特征,mel倒谱系数mfcc和感知线性预测 plp是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。mel刻度是对这一临界带宽的度量方法之一。
3、倒谱系数cep
利用同态处理方法,对语音信号求离散傅立叶变换dft后取对数,再求反变换idft就可得到倒谱系数。对lpc倒谱(lpccep),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以提高特征参数的稳定性。

深圳旭源亿科技公司
400 0755 908

该用户其它信息

VIP推荐

400 0755 908
 发送短信
免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product