Training a language model using webdata for large vocabulary Japanese spontaneous speech recognition

被引：0

作者：

Masumura, Ryo ^{[1
]}

Hahm, Seongjun ^{[1
]}

Ito, Akinori ^{[1
]}

机构：

[1] Tohoku Univ, Grad Sch Engn, Sendai, Miyagi 980, Japan

来源：

12TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2011 (INTERSPEECH 2011), VOLS 1-5 | 2011年

关键词：

Spontaneous speech recognition; language model; World Wide Web; large vocabulary continuous speech recognition; Corpus of Spontaneous Japanese;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

This paper describes a language modeling method using large-scale spoken language data retrieved from the Web for spontaneous speech recognition. We downloaded 15 million Web pages on a comprehensive range topics. Next, spoken language-like texts were selected from the downloaded Web data using the naive Bayes classifier, and typical linguistic phenomena such as fillers and pauses were added using simulation models. A language model trained by the generated data gave as high performance as the large-scale spontaneous speech corpus (Corpus of Spontaneous Japanese, CSJ). By combining the generated data and CSJ, we improved word accuracy.

引用

页码：1476 / 1479

页数：4

共 50 条

[21] RECURRENT NEURAL NETWORK LANGUAGE MODEL TRAINING WITH NOISE CONTRASTIVE ESTIMATION FOR SPEECH RECOGNITION
Chen, X.
Liu, X.
Gales, M. J. E.
Woodland, P. C.
2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 2015, : 5411 - 5415
[22] Long Short-Term Memory Based Language Model for Indonesian Spontaneous Speech Recognition
Putri, Fanda Yuliana
Lestari, Dessi Puji
Widyantoro, Dwi Hendratmo
2018 INTERNATIONAL CONFERENCE ON COMPUTER, CONTROL, INFORMATICS AND ITS APPLICATIONS (IC3INA), 2018, : 44 - 48
[23] Topic-independent speaking-style transformation of language model for spontaneous speech recognition
Akita, Yuya
Kawahara, Tatsuya
2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3, 2007, : 33 - +
[24] Large Vocabulary Continuous Speech Recognition Using WFST-based Linear Classifier for Structured Data
Watanabe, Shinji
Hori, Takaaki
Nakamura, Atsushi
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 1-2, 2010, : 346 - 349
[25] Topic tracking language model for speech recognition
Watanabe, Shinji
Iwata, Tomoharu
Hori, Takaaki
Sako, Atsushi
Ariki, Yasuo
COMPUTER SPEECH AND LANGUAGE, 2011, 25 (02) : 440 - 461
[26] Large Vocabulary Continuous Speech Recognition in Uyghur: Data Preparation and Experimental Results
Tursun, Nasirjan
Silamu, Wushour
2008 6TH INTERNATIONAL SYMPOSIUM ON CHINESE SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, 2008, : 197 - 200
[27] Large Vocabulary Continuous Speech Recognition With Reservoir-Based Acoustic Models
Triefenbach, Fabian
Demuynck, Kris
Martens, Jean-Pierre
IEEE SIGNAL PROCESSING LETTERS, 2014, 21 (03) : 311 - 315
[28] Extra Large Vocabulary Continuous Speech Recognition Algorithm based on Information Retrieval
Pylypenko, Valeriy
INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4, 2007, : 1809 - 1812
[29] INTERNAL LANGUAGE MODEL TRAINING FOR DOMAIN-ADAPTIVE END-TO-END SPEECH RECOGNITION
Meng, Zhong
Kanda, Naoyuki
Gaur, Yashesh
Parthasarathy, Sarangarajan
Sun, Eric
Lu, Liang
Chen, Xie
Li, Jinyu
Gong, Yifan
2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, : 7338 - 7342
[30] ADVANCES IN LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION IN GREEK: MODELING AND NONLINEAR FEATURES
Rodomagoulakis, Isidoros
Potamianos, Gerasimos
Maragos, Petros
2013 PROCEEDINGS OF THE 21ST EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO), 2013,

← 1 2 3 4 5 →