Fcs'20 a survey on ensemble learning

论文链接: https://link.springer.com/article/10.1007/s11704-019-8208-z

集成学习方法利用多种机器学习算法,基于通过对数据的多样性投影提取的特征产生弱预测结果,并将结果与各种投票机制融合,以实现比单独从任何组成算法获得的性能更好的性能。[1] 在Kaggle比赛中,集成学习取得了令人满意的成绩。

1.监督集成分类

1.1经典集成学习方法

Bagging[5],AdaBoost[6],随机森林[7],随机子空间[8],gradient boosting[9]

  • Bagging方法通过从训练数据集中随机采样来生成样本子集,然后使用这些获得的子集来训练用于集成的基本模型。
  • AdaBoost通过迭代调整样本的权重来关注被错误分类的样本,从而提高最终集成的基本模型的分类性能。 image.png
  • 随机森林从两个角度训练多个决策树模型:样本维度和特征维度。因此,它通过集成多个决策树的投票结果来缓解决策树容易过度拟合的问题。
  • 随机子空间通过随机采样特征构建一组特征子空间,然后在这些子空间中训练基本分类器以生成多个结果,然后融合到最终结果中。
  • Gradient Boosting 随机采样以获得样本子集,然后构建和训练每个子学习器,以减少前一个子学习器产生的残差。因此,梯度增强可以使来自集成模型的最终残差之和足够小,从而迫使预测接近实际值。(欠拟合和过拟合的结合?) image.png

1.2例子:

  • Ye等人[13]提出了一种分层采样方法,将特征分为两组:一组具有强信息,另一组具有弱信息。有了这两组,可以通过按比例从每组中采样来构建多个特征子空间。(避免样本分布不均匀)

许多基本模型被训练后用于预测,然后集成模型通过一致性函数融合来自这些基本模型的预测结果。接下来是选择子学习器的一些算法用例。

  • 周和唐[27]提出了使用比特串来表示树分类器在集合中的外观的GASEN-b算法,并对比特串采用遗传算法进行分类器选择。(用于子学习器数量较多的时候)
  • Dos Santos等人[31]将优化过程与动态选择策略相结合,以高精度选择最有信心的分类器子集。

如何更好地整合基本模型的结果:

  • 决策树——De Stefano等人[34]利用贝叶斯网络合并决策树集合的响应,提高了性能,大大减少了分类器的数量。
  • 聚类算法——Rahman和Verma[35]提出了一种面向聚类的分层集成分类算法,该算法集成了通过将聚类算法应用于多层数据而生成的分类器。
  • SVM——Zhang和Suganthan[37]将支持向量机引入到倾斜决策树集成[38]中,以帮助获得内部节点进行分类的测试超平面。
  • NN——周等人[39]提出了一种基于神经网络的集成方法,通过遗传算法更新网络的权值。

理论知识:

  • 王等[43]发现,随着基本分类器的模糊性越来越高,集成分类模型在处理具有复杂边界的数据集时可以获得更好的泛化能力
  • Yin等人[46]研究了集成模型的稀疏性和多样性,并引入了称为多样性贡献能力的概念用于分类器选择和权重调整。
  • 视频注释[84]和图像检索[87]

2.半监督集成分类

半监督集合分类方法侧重于扩展训练集并利用这些扩展的训练集。(不适合我们的现在工作)

3.聚类集成

聚类集成算法的工作原理是使用聚类算法生成一系列聚类分区,并将这些分区组合在一起以获得一致解。

  • Ayad和Kamel[121]将投票问题转化为涉及多响应和多输入变量的回归问题,并采用随机生成技术生成基本分区,该方法利用信息论算法,借助二分匹配和累积投票,从学习的集合表示中获得一致聚类和聚类数量。

理论知识:

  • Amasyali和Ersoy[125]研究了对聚类集成算法性能产生重大影响的不同因素

如何从集合模型挑选聚类结果:

  • Fern和Lin[133]研究了如何基于聚类的多样性和质量有效地为集合选择聚类结果。第一种方法通过联合目标函数将它们结合起来,第二种方法将聚类成员分为不同的组,并在每组中选择高质量的解,第三种方法利用点来表示一对聚类解的平均质量和多样性,然后选择具有凸霍尔的解。

4.半监督聚类集成

半监督聚类集成算法侧重于利用不能链接和必须链接等先验知识来指导聚类集成过程。

  • [158]Chameleon: hierarchical clustering using dynamic modeling
  • Mahmood等人[169]采用半监督聚类集成方法对网络视频进行分类,并使用遗传算法(GA)帮助迭代用于社交媒体挖掘的聚类集成过程[170]。

5. 新方向

  • 此外,基于不同卷积神经网络(CNN)架构学习不同级别的语义表示的假设,Kumar等人[176]通过对在自然图像的大数据集上初始化的CNN进行集成,开发了一种新的特征提取器。实验表明,与传统的细胞神经网络相比,细胞神经网络集合可以提取出更高质量的特征。
  • 刘等人[177]将具有不同架构的卷积神经网络模型集成应用于视觉交通监控系统。

This line appears after every note.

Notes mentioning this note


Here are all the notes in this garden, along with their links, visualized as a graph.

Conda导出python环境加快访问github新闻稿实验1:ros入门实验3:自动驾驶实战实验4:ros2智能移动机器人实验5:ros1移动机器人动态避障(基于强化学习)实验6:轨迹跟踪仿真1最终实验自动驾驶辅助python函数Obsidian发布的免费替代方案Obsidian库解析TestYour first seedClip 串讲Icml'23 blip 2 bootstrapping language Image pre...Nips'17 attention is all you needSigir'22 cret cross Modal retrieval transformer...Arxiv 2306’unifying large language models and...Arxiv'21 how much can clip benefit vision And...⭐ ⭐ ⭐ ⭐ ⭐ arxiv 2311' llmsurveychinese⭐⭐⭐⭐eccv'22 slip:self Supervision meets language...⭐⭐⭐⭐⭐clip:learning transferable visual models from...⭐⭐⭐⭐⭐icml'22 blip bootstrapping language Image pre...Acl'25 a survey of mathematical reasoning in the...Arxiv'23 challenges and applications of large...Prl'20 retrieving quantum information with active...SIGIR'06 Laplacian Optimal Design for Image...Survey'09active learningTKDE'16Relevance Feedback Algorithms Inspired By...Improving interpretable embeddings for ad Hoc...Access'17...Artif. intell. rev.‘23 a survey on ensemble...Fcs'20 a survey on ensemble learningTpmai'04 asymmetric bagging and random subspace...⭐⭐⭐⭐access'22 a survey of ensemble learning进化集成学习算法综述《黑客与画家》 为什么书呆子不受欢迎《黑客与画家》《黑客与画家》——黑客与画家黑客伦理250701 250708 阅读Avs检索流程Avs项目管理Avs speaker proposalAvs paper思路整理Presentation 思路整理Stable Diffusion检索流程2023avs交互使用flask快速构建浏览器实现图片交互Trecvid avs 个人感受2022交互情况统计2024avs交互情况统计Llm api测试Agi 比赛Lean(vs code)Agic TrickLlm相关论文Rtx 4090 部署大模型 20240306构建样题数据集调查开源大模型的数学能力想法计划231128调研Github下载Python调用javaVbs2024比赛复盘复现系统talkseeDiffusion扩散模型调研2023 mindspore量子计算黑客马拉松全国大赛热身题2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道代码集成进化算法Python使用Vscode使用Github问题HuggingfaceLinux华为手机安装google框架工具推荐科研问题笔记本电脑视频生成调研20241002更换内存条(16g换到32g)24考研总结Reflection 大学四年的回顾及年终总结《周处除三害》观后感《奥本海默》观后感《白金数据》书评李沐讲座考研计划牛奶2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道排序融合动手学习深度学习算法笔记论文阅读模板算法知识生活Paper ReadingProjectsWeekly Summary