自适应高斯混合模型及说话人识别应用

被引:10
作者
王韵琪
俞一彪
机构
[1] 苏州大学电子信息学院
关键词
说话人识别; 自适应高斯混合模型; 双线性频率倒谱系数;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。
引用
收藏
页码:738 / 743
页数:6
相关论文
共 3 条
[1]   基于GMM说话人分类的说话人识别方法研究 [J].
赵振东 ;
张静 ;
李圆 ;
胡喜梅 .
通信技术, 2009, 42 (10) :192-193
[2]   一种适于说话人识别的非线性频率尺度变换 [J].
俞一彪 ;
袁冬梅 ;
薛峰 .
声学学报(中文版), 2008, (05) :450-455
[3]  
Robust text -independent speaker identification using Gaussian mixture speaker models .2 Reynolds DA,Rose RC. IEEE Transactions on Speech and Audio Proceessing . 1995