Approaches for Out-of-Domain Adaptation to Improve Speaker Recognition Performance

被引：0

作者：

Shulipa, Andrey ^{[1
]}

Novoselov, Sergey ^{[1
,2
]}

Melnikov, Aleksandr ^{[2
]}

机构：

[1] ITMO Univ, St Petersburg, Russia

[2] Speech Technol Ctr, St Petersburg, Russia

来源：

SPEECH AND COMPUTER | 2016年 / 9811卷

关键词：

Speaker recognition; Domain adaptation; Mismatch conditions;

D O I：

10.1007/978-3-319-43958-7_14

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In last years satisfactory performance of speaker recognition (SR) systems have been achieved in evaluations provided by NIST. It was possible due to using large datasets to train system parameters and accurate speaker variability modeling. In such a cases test and train conditions are similar and it ensures good performance for the evaluations. However in practical applications when training and testing conditions are different the problem of mismatching of the optimal SR system parameters occurs. It is the main problem in the deployment of the real application systems. It leads to reducing SR systems effectiveness. This paper investigates discriminative and generative approaches for the adaptation of the parameters of the speaker recognition systems and proposes effective solutions to improve their performance.

引用

页码：124 / 130

页数：7

共 50 条

[1] On robustness of unsupervised domain adaptation for speaker recognition
Bousquet, Pierre-Michel
Rouvier, Mickael
INTERSPEECH 2019, 2019, : 2958 - 2962
[2] DOMAIN ADAPTATION FOR SPEAKER RECOGNITION IN SINGING AND SPOKEN VOICE
Chowdhury, Anurag
Cozzo, Austin
Ross, Arun
2022 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2022, : 7192 - 7196
[3] Contrastive Adversarial Domain Adaptation Networks for Speaker Recognition
Li, Longxin
Mak, Man-Wai
Chien, Jen-Tzung
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 33 (05) : 2236 - 2245
[4] DOMAIN AND SPEAKER ADAPTATION FOR CORTANA SPEECH RECOGNITION
Zhao, Yong
Li, Jinyu
Zhang, Shixiong
Chen, Liping
Gong, Yifan
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 5984 - 5988
[5] THE CORAL plus plus ALGORITHM FOR UNSUPERVISED DOMAIN ADAPTATION OF SPEAKER RECOGNITION
Li, Rongjin
Zhang, Weibin
Chen, Dongpeng
2022 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2022, : 7172 - 7176
[6] A GENERALIZED FRAMEWORK FOR DOMAIN ADAPTATION OF PLDA IN SPEAKER RECOGNITION
Wang, Qiongqiong
Okabe, Koji
Lee, Kong Aik
Koshinaka, Takafumi
2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2020, : 6619 - 6623
[7] IMPROVING SPEAKER RECOGNITION PERFORMANCE IN THE DOMAIN ADAPTATION CHALLENGE USING DEEP NEURAL NETWORKS
Garcia-Romero, Daniel
Zhang, Xiaohui
McCree, Alan
Povey, Daniel
2014 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY SLT 2014, 2014, : 378 - 383
[8] UNSUPERVISED DOMAIN ADAPTATION VIA DOMAIN ADVERSARIAL TRAINING FOR SPEAKER RECOGNITION
Wang, Qing
Rao, Wei
Sun, Sining
Xie, Lei
Chng, Eng Siong
Li, Haizhou
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 4889 - 4893
[9] Generalized Domain Adaptation Framework for Parametric Back-End in Speaker Recognition
Wang, Qiongqiong
Okabe, Koji
Lee, Kong Aik
Koshinaka, Takafumi
IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2023, 18 : 3936 - 3947
[10] LOW-RESOURCE DOMAIN ADAPTATION FOR SPEAKER RECOGNITION USING CYCLE-GANS
Nidadavolu, Phani Sankar
Kataria, Saurabh
Villalba, Jesus
Dehak, Najim
2019 IEEE AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING WORKSHOP (ASRU 2019), 2019, : 710 - 717

← 1 2 3 4 5 →