深度语音信号与信息处理:研究进展与展望

被引:31
作者
戴礼荣
张仕良
机构
[1] 中国科学技术大学语音与语言信息处理国家工程实验室
关键词
深度学习; 深度神经网络; 语音识别; 语音合成; 语音增强;
D O I
10.16337/j.1004-9037.2014.02.004
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说话人自适应技术;语音合成方向主要介绍了基于深度学习模型的若干语音合成方法;语音增强方向主要介绍了基于深度神经网络的若干典型语音增强方案。最后对深度学习在语音信与信息处理领域的未来可能的研究热点进行展望。
引用
收藏
页码:171 / 179
页数:9
相关论文
共 3 条
[1]   Statistical parametric speech synthesis [J].
Zen, Heiga ;
Tokuda, Keiichi ;
Black, Alan W. .
SPEECH COMMUNICATION, 2009, 51 (11) :1039-1064
[2]  
Linear hidden transformations for adaptation of hybrid ANN/HMM models[J] . Roberto Gemello,Franco Mana,Stefano Scanzio,Pietro Laface,Renato De Mori.Speech Communication . 2006 (10)
[3]   Catastrophic forgetting in connectionist networks [J].
French, RM .
TRENDS IN COGNITIVE SCIENCES, 1999, 3 (04) :128-135