A Small Vocabulary Automatic Filipino Speech Profanity Suppression System Using Hybrid Hidden Markov Model/Artificial Neural Network (HMM/ANN) Keyword Spotting Framework

被引：0

作者：

Ablaza, Fernando I., Jr. ^{[1
]}

Danganan, Timothy Oliver D. ^{[1
]}

Javier, Bryan Paul L. ^{[1
]}

Manalang, Kevin S. ^{[1
]}

Montalvo, Denise Erica V. ^{[1
]}

Ambata, Leonard U. ^{[1
]}

机构：

[1] De La Salle Univ, Dept Elect & Commun Engn, Manila, Philippines

来源：

2014 INTERNATIONAL CONFERENCE ON HUMANOID, NANOTECHNOLOGY, INFORMATION TECHNOLOGY, COMMUNICATION AND CONTROL, ENVIRONMENT AND MANAGEMENT (HNICEM) | 2014年

关键词：

Artificial Neural Network (ANN); Hidden Markov Model (HMM); Mel Frequency Cepstral Coefficients (MFCC); Multi-layer Perceptron (MLP);

D O I：

暂无

中图分类号：

T [工业技术];

学科分类号：

08 ;

摘要：

This paper describes an implementation of speech recognition that recognizes and suppresses ten (10) defined profane and vulgar Filipino words. The adapted speech recognition architecture was that of the Oregon Graduate Institute's (OGI) Center for Spoken Language and Learning (CSLU). It utilizes a hybrid Hidden Markov Model / Artificial Neural Network (HMM/ANN) keyword spotting framework. The feature extraction method used was Mel-Frequency Cepstral Coefficients (MFCC). The ANN is a 3-layer feed-forward neural network using Multi-Layer Perceptron (MLP). In recognizing the words, an HMM decoder was used which implemented the Viterbi Beam Search Algorithm. Whenever a profane word was recognized, it would be replaced with a constant frequency tone. The training and testing data (recordings) were gathered from 30 random (15 male and 15 female) Filipino speakers.

引用

页数：5

共 10 条

[1] Ablaza Jr F., 2010, JAMMD PROFANITY SUPP
[2] CARMELL T, 1997, SPECTROGRAM READING
[3] Cole R., 1999, SPEECH RECOGNITION U
[4] European Broadcsting Union, 2001, BWF FORM AUD DAT FIL, V1
[5] Fanty M., 1996, CSLU C TOOLKIT AUTOM
[6] Goldwave Incorporated, 2010, GOLDW VERS 5 57 SOFT
[7] HOSOM JP, 2006, TRAINING HIDDEN MARK
[8] Kapisanan ng mga Brodkaster sa Pilipinas, 2007, 2007 BROADC COD PHIL
[9] Connectionist Probability Estimators in HMM Speech Recognition
Renals, Steve
Morgan, Nelson
Bourlard, Herve
Cohen, Michael
Franco, Horacio
[J]. IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, 1994, 2 (01): : 161 - 174
[10] Royal Institute of Technology (KTH) Department of Speech Music and Hearing, 2005, WAVESURFER VERS 1 8

← 1 →