循环神经网络研究综述

被引:438
作者
杨丽 [1 ]
吴雨茜 [1 ]
王俊丽 [1 ]
刘义理 [2 ]
机构
[1] 同济大学电子与信息工程学院
[2] 同济大学经济与管理学院
关键词
循环神经网络; 长短期记忆网络; 深度学习; 神经网络; 序列数据;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
循环神经网络(RNN)是一类非常强大的用于处理和预测序列数据的神经网络模型。循环结构的神经网络克服了传统机器学习方法对输入和输出数据的许多限制,使其成为深度学习领域中一类非常重要的模型。RNN及其变体网络已经被成功应用于多种任务,尤其是当数据中存在一定时间依赖性的时候。语音识别、机器翻译、语言模型、文本分类、词向量生成、信息检索等,都需要一个模型能够将具有序列性质的数据作为输入进行学习;然而,RNN通常难以训练,循环多次之后,大多数情况下梯度往往倾向于消失,也有较少情况会发生梯度爆炸的问题。针对RNN在实际应用中存在的问题,长短期记忆(LSTM)网络被提出,它能够保持信息的长期存储而备受关注,关于LSTM结构的改进工作也陆续出现。然后,主要针对循环结构的神经网络的发展进行详细阐述,对目前流行的几种变体模型进行详细的讨论和对比。最后,对循环结构的神经网络的发展趋势进行了探讨。
引用
收藏
页码:1 / 6+26 +26
页数:7
相关论文
共 12 条
[1]   基于深度学习的问题分类方法研究 [J].
李超 ;
柴玉梅 ;
南晓斐 ;
高明磊 .
计算机科学, 2016, 43 (12) :115-119
[2]   基于LSTM网络的序列标注中文分词法 [J].
任智慧 ;
徐浩煜 ;
封松林 ;
周晗 ;
施俊 .
计算机应用研究, 2017, 34 (05) :1321-1324+1341
[3]   基于词向量特征的循环神经网络语言模型 [J].
张剑 ;
屈丹 ;
李真 .
模式识别与人工智能, 2015, 28 (04) :299-305
[4]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
[5]  
Learning to Forget: Continual Prediction with LSTM[J] . Felix A. Gers,J&uuml,rgen Schmidhuber,Fred Cummins.Neural Computation . 2000 (10)
[6]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[7]  
A method of emotional analysis of movie based on convolution neural network and bi-directional LSTM RNN. LI S D,YAN Z,WU X B,et al. 2017 IEEE Second International Conference on Data Science in Cyberspace . 2017
[8]  
Gated word-character recurrent language model. MIYAMOTO Y,CHO K. . 2016
[9]  
Robust LSTMautoencoders for face de-occlusion in the wild. Zhao F,Feng J,Zhao J,et al. IEEE Transactions on Image Processing . 2018
[10]  
Global context-aware attention LSTM networks for 3D action recognition. LIU J,WANG G,HU P,et al. IEEE Conference on Computer Vision and Pattern Recognition . 2017