基于核函数的IVEC-SVM说话人识别系统研究

被引:9
作者
栗志意
张卫强
何亮
刘加
机构
[1] 清华大学电子工程系清华信息与科学技术国家实验室
关键词
身份认证向量后接余弦距离打分; 身份认证向量后接支持向量机; Spline核; 说话人识别;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
在说话人识别研究中,基于身份认证向量(Identity vector,IVEC)的说话人建模方法可以有效地提取说话人信息,是目前处于国际前沿的建模方法.本文对身份认证向量后接支持向量机(Identity vector followed by support vector machine,IVEC-SVM)的说话人识别系统进行了研究,对比了该系统在十种不同核函数下的识别性能,并与文献中身份认证向量后接余弦距离打分(Identity vector followed by cosine distance scoring,IVEC-CDS)系统进行了比较.在美国国家标准技术局(American National Institute of Standards and Technology,NIST)组织的2010年电话信道—电话信道说话人识别核心评测数据库上的实验结果显示,基于核函数的IVEC-SVM系统性能明显优于IVEC-CDS的系统性能.此外,实验结果表明基于Spline核的IVEC-SVM系统可取得最好的识别性能,与IVEC-CDS系统相比,其等错点(Equal error rate,EER)在分数归一化前后分别降低了10%和3%.
引用
收藏
页码:780 / 784
页数:5
相关论文
共 5 条
[1]   基于鉴别性i-vector局部距离保持映射的说话人识别 [J].
栗志意 ;
何亮 ;
张卫强 ;
刘加 .
清华大学学报(自然科学版), 2012, 52 (05) :598-601
[2]  
An overview of text-independent speaker recognition: From features to supervectors[J] . Tomi Kinnunen,Haizhou Li. Speech Communication . 2009 (1)
[3]  
Support vector machines for speaker and language recognition[J] . W.M. Campbell,J.P. Campbell,D.A. Reynolds,E. Singer,P.A. Torres-Carrasquillo. Computer Speech & Language . 2005 (2)
[4]  
Speaker Verification Using Adapted Gaussian Mixture Models[J] . Douglas A. Reynolds,Thomas F. Quatieri,Robert B. Dunn. Digital Signal Processing . 2000 (1)
[5]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297