随机森林模型在分类与回归分析中的应用

被引:342
|
作者
李欣海 [1 ]
机构
[1] 中国科学院动物研究所
关键词
随机森林; 分类树; 判别分析; 回归; 机器学习;
D O I
暂无
中图分类号
S711 [森林数学];
学科分类号
0829 ; 0907 ;
摘要
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。
引用
收藏
页码:1190 / 1197
页数:8
相关论文
共 11 条
  • [1] 用组合模型综合比较的方法分析气候变化对朱鹮潜在生境的影响
    翟天庆
    李欣海
    [J]. 生态学报, 2012, 32 (08) : 2361 - 2370
  • [2] Vulnerability of 208 endemic or endangered species in China to the effects of climate change
    Li, Xinhai
    Tian, Huidong
    Wang, Yuan
    Li, Renqiang
    Song, Zengming
    Zhang, Fengchun
    Xu, Ming
    Li, Dianmo
    [J]. REGIONAL ENVIRONMENTAL CHANGE, 2013, 13 (04) : 843 - 852
  • [3] Classification in conservation biology: A comparison of five machine-learning methods[J] . Christian Kampichler,Ralf Wieland,Sophie Calmé,Holger Weissenberger,Stefan Arriaga-Weiss.Ecological Informatics . 2010 (6)
  • [4] Variable selection using random forests
    Genuer, Robin
    Poggi, Jean-Michel
    Tuleau-Malot, Christine
    [J]. PATTERN RECOGNITION LETTERS, 2010, 31 (14) : 2225 - 2236
  • [5] Variable Importance Assessment in Regression: Linear Regression versus Random Forest[J] . Ulrike Gr?mping.The American Statistician . 2009 (4)
  • [6] Why the crested ibis declined in the middle twentieth century
    Li, Xinhai
    Tian, Huidong
    Li, Dianmo
    [J]. BIODIVERSITY AND CONSERVATION, 2009, 18 (08) : 2165 - 2172
  • [7] Estimating potential habitat for 134 eastern US tree species under six climate scenarios[J] . Louis R. Iverson,Anantha M. Prasad,Stephen N. Matthews,Matthew Peters.Forest Ecology and Management . 2007 (3)
  • [8] Empirical characterization of random forest variable importance measures[J] . Kellie J. Archer,Ryan V. Kimes.Computational Statistics and Data Analysis . 2007 (4)
  • [9] Nest site use by crested ibis: dependence of a multifactor model on spatial scale[J] . Xinhai Li,Dianmo Li,Zhijun Ma,David C. Schneider.Landscape Ecology . 2006 (8)
  • [10] Random forests
    Breiman, L
    [J]. MACHINE LEARNING, 2001, 45 (01) : 5 - 32