TIME-FREQUENCY MASKING-BASED SPEECH ENHANCEMENT USING GENERATIVE ADVERSARIAL NETWORK

被引：0

作者：

Soni, Meet H. ^{[1
]}

Shah, Neil ^{[1
]}

Patil, Hemant A. ^{[1
]}

机构：

[1] Dhirubhai Ambani Inst Informat & Commun Technol, Gandhinagar, India

来源：

2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) | 2018年

关键词：

Task-dependent masking; speech enhancement; generative adversarial networks;

D O I：

暂无

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

The success of time-frequency (T-F) mask-based approaches is dependent on the accuracy of predicted mask given the noisy spectral features. The state-of-the-art methods in T-F masking-based enhancement employ Deep Neural Network (DNN) to predict mask. Recently, Generative Adversarial Networks (GAN) are gaining popularity instead of maximum likelihood (ML)-based optimization of deep learning architectures. In this paper, we propose to exploit GAN in TF masking-based enhancement framework. We present the viable strategy to use GAN in such application by modifying the existing approach. To achieve this, we use a method that learns the mask implicitly while predicting the clean TF representation. Moreover, we show the failure of vanilla GAN in predicting the accurate mask and propose a regularized objective function with the use of Mean Square Error (MSE) between predicted and target spectrum to overcome it. The objective evaluation of the proposed method shows the improvement in the accurate mask prediction, as against the state-of-the-art ML-based optimization techniques. The proposed system significantly improves over a recent GAN-based speech enhancement system in improving speech quality, while maintaining a better trade-off between less speech distortion and more effective removal of background interferences present in the noisy mixture.

引用

页码：5039 / 5043

页数：5

共 50 条

[31] SPEECH ENHANCEMENT BASED ON JOINT TIME-FREQUENCY SEGMENTATION
Tantibundhit, C.
Pernkopf, F.
Kubin, G.
2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS, 2009, : 4673 - +
[32] Speech Feature Enhancement based on Time-frequency Analysis
Do, Duc-Hao
Chau, Thanh-Duc
Tran, Thai-Son
ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING, 2023, 22 (08)
[33] A Phase-Based Time-Frequency masking for multi-channel speech enhancement in domestic environments
Brutti, Alessio
Tsiami, Antigoni
Katsamanis, Athanasios
Maragos, Petros
17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2016), VOLS 1-5: UNDERSTANDING SPEECH PROCESSING IN HUMANS AND MACHINES, 2016, : 2875 - 2879
[34] Time-Frequency Domain Seismic Signal Denoising Based on Generative Adversarial Networks
Wei, Ming
Sun, Xinlei
Zong, Jianye
APPLIED SCIENCES-BASEL, 2024, 14 (11):
[35] Self-supervised time-frequency representation based on generative adversarial networks
Liu, Naihao
Lei, Youbo
Yang, Yang
Wei, Shengtao
Gao, Jinghuai
Jiang, Xiudi
GEOPHYSICS, 2023, 88 (04) : IM87 - IM99
[36] LANGUAGE AND NOISE TRANSFER IN SPEECH ENHANCEMENT GENERATIVE ADVERSARIAL NETWORK
Pascual, Santiago
Park, Maruchan
Serra, Joan
Bonafonte, Antonio
Ahn, Kang-Hun
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 5019 - 5023
[37] Speech Enhancement via Residual Dense Generative Adversarial Network
Zhou, Lin
Zhong, Qiuyue
Wang, Tianyi
Lu, Siyuan
Hu, Hongmei
COMPUTER SYSTEMS SCIENCE AND ENGINEERING, 2021, 38 (03): : 279 - 289
[38] SELF-ATTENTION GENERATIVE ADVERSARIAL NETWORK FOR SPEECH ENHANCEMENT
Huy Phan
Nguyen, Huy Le
Chen, Oliver Y.
Koch, Philipp
Duong, Ngoc Q. K.
McLoughlin, Ian
Mertins, Alfred
2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, : 7103 - 7107
[39] Improved Wasserstein conditional generative adversarial network speech enhancement
Shan Qin
Ting Jiang
EURASIP Journal on Wireless Communications and Networking, 2018
[40] Improved Wasserstein conditional generative adversarial network speech enhancement
Qin, Shan
Jiang, Ting
EURASIP JOURNAL ON WIRELESS COMMUNICATIONS AND NETWORKING, 2018,

← 1 2 3 4 5 →