软件工程数据挖掘研究进展

被引:15
作者
郁抒思 [1 ,2 ]
周水庚 [1 ,2 ]
关佶红 [3 ]
机构
[1] 复旦大学计算机科学技术学院
[2] 复旦大学上海市智能信息处理重点实验室
[3] 同济大学计算机科学与技术系
关键词
软件工程; 数据挖掘; 数据表示; 数据预处理; 机器学习;
D O I
暂无
中图分类号
TP311.52 [];
学科分类号
摘要
随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。
引用
收藏
页码:1 / 31
页数:31
相关论文
共 9 条
  • [1] Classifying Software Changes: Clean or Buggy?[J] . Kim, Sunghun,Whitehead Jr, E James,Zhang, Yi.IEEE Transactions on Software Engineering . 2008 (2)
  • [2] Approaches for Categorization of Reusable Software Components[J] . Parvinder S. Sandhu,Janpreet Singh,Hardeep Singh.Journal of Computer Science . 2007 (5)
  • [3] A brief survey of program slicing[J] . Baowen Xu,Ju Qian,Xiaofang Zhang,Zhongqiang Wu,Lin Chen.ACM SIGSOFT Software Engineering Notes . 2005 (2)
  • [4] Evolutionary testing of classes[J] . Paolo Tonella.ACM SIGSOFT Software Engineering Notes . 2004 (4)
  • [5] An introduction to latent semantic analysis[J] . Thomas K. Landauer,Peter W. Foltz,Darrell Laham.Discourse Processes . 1998 (2-3)
  • [6] BIRCH[J] . Tian Zhang,Raghu Ramakrishnan,Miron Livny.ACM SIGMOD Record . 1996 (2)
  • [7] Automatic generation of software behavioral models. Lorenzoli D,Mariani L,PezzèM. Proceedings of the30th International Conference on Software Engineering(ICSE’’08) . 2008
  • [8] Probabilistic latent semantic analysis. Hof mann T. Proceedings of the 22nd annual ACMconference on research and developmentininformation retrieval . 1999
  • [9] Scalable statistical bug isolation. Liblit B,Naik M,Zheng A X,et al. Proceedings of the 2005 ACM SIGPLAN Conference on Programming Language Design and Implementation (PLDI’’05) . 2005