图像理解中的卷积神经网络

被引:415
|
作者
常亮 [1 ,2 ]
邓小明 [3 ]
周明全 [1 ,2 ]
武仲科 [1 ,2 ]
袁野 [3 ,4 ]
杨硕 [3 ,4 ]
王宏安 [3 ]
机构
[1] 北京师范大学信息科学与技术学院
[2] 教育部虚拟现实应用工程研究中心
[3] 中国科学院软件研究所人机交互北京市重点实验室
[4] 中国科学院大学计算机与控制学院
关键词
卷积神经网络; 图像理解; 深度学习; 图像分类; 物体检测;
D O I
10.16383/j.aas.2016.c150800
中图分类号
TP391.41 []; TP183 [人工神经网络与计算];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
近年来,卷积神经网络(Convolutional neural networks,CNN)已在图像理解领域得到了广泛的应用,引起了研究者的关注.特别是随着大规模图像数据的产生以及计算机硬件(特别是GPU)的飞速发展,卷积神经网络以及其改进方法在图像理解中取得了突破性的成果,引发了研究的热潮.本文综述了卷积神经网络在图像理解中的研究进展与典型应用.首先,阐述卷积神经网络的基础理论;然后,阐述其在图像理解的具体方面,如图像分类与物体检测、人脸识别和场景的语义分割等的研究进展与应用.
引用
收藏
页码:1300 / 1312
页数:13
相关论文
共 7 条
  • [1] 高阶马尔科夫随机场及其在场景理解中的应用
    余淼
    胡占义
    [J]. 自动化学报, 2015, 41 (07) : 1213 - 1234
  • [2] 图像语义分析[M]. 科学出版社 , 郭平, 2015
  • [3] 模式分类[M]. 机械工业出版社 , (美)RichardO.Duda等著, 2003
  • [4] Real-Time Continuous Pose Recovery of Human Hands Using Convolutional Networks
    Tompson, Jonathan
    Stein, Murphy
    Lecun, Yann
    Perlin, Ken
    [J]. ACM TRANSACTIONS ON GRAPHICS, 2014, 33 (05):
  • [5] Selective Search for Object Recognition
    Uijlings, J. R. R.
    van de Sande, K. E. A.
    Gevers, T.
    Smeulders, A. W. M.
    [J]. INTERNATIONAL JOURNAL OF COMPUTER VISION, 2013, 104 (02) : 154 - 171
  • [6] Backpropagation Applied to Handwritten Zip Code Recognition
    LeCun, Y.
    Boser, B.
    Denker, J. S.
    Henderson, D.
    Howard, R. E.
    Hubbard, W.
    Jackel, L. D.
    [J]. NEURAL COMPUTATION, 1989, 1 (04) : 541 - 551
  • [7] 从统一子空间分析到联合深度学习:人脸识别的十年历程. 王晓刚,孙衤韦,汤晓鸥. 中国计算机学会通讯 . 2015