GMM文本无关的说话人识别系统研究

被引:28
作者
蒋晔
唐振民
机构
[1] 南京理工大学计算机科学与技术学院
关键词
说话人识别; 高斯混合模型; 美尔频率倒谱系数(MFCC); 分裂法与K均值聚类结合法;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。
引用
收藏
页码:179 / 182+195 +195
页数:5
相关论文
共 7 条
[1]   Improved MFCC-Based Feature for Robust Speaker Identification [J].
吴尊敬 ;
曹志刚 .
TsinghuaScienceandTechnology, 2005, (02) :158-161
[2]   文本无关的说话人识别:综述 [J].
岳喜才 ;
叶大田 .
模式识别与人工智能, 2001, 14 (02) :194-200
[3]  
说话人识别中提高GMM性能方法的研究[D]. 姚志强.中国科学技术大学. 2006
[4]  
现代语音处理技术及应用[M]. 机械工业出版社 , 张雄伟等编著, 2003
[5]  
Speaker Verification Using Adapted Gaussian Mixture Models[J] . Douglas A. Reynolds,Thomas F. Quatieri,Robert B. Dunn.Digital Signal Processing . 2000 (1)
[6]   Joint estimation of feature transformation parameters and Gaussian mixture model for speaker identification [J].
Yuo, KH ;
Wang, HC .
SPEECH COMMUNICATION, 1999, 28 (03) :227-241
[7]  
Speaker identification and verification using Gaussian mixture speaker models[J] . Douglas A. Reynolds.Speech Communication . 1995 (1)