数据挖掘导论第二版第4章集成学习方法

组合方法的几种常见玩法讲得挺清楚的，尤其是Bagging和Boosting那块，基本就是你日常调分类器绕不开的核心套路。讲步骤的时候有条理，直接告诉你咋做，咋组合，怎么提升准确率，挺实用。

Bagging的比较到位，从随机采样讲到如何组合多个模型，像Random Forest这种常见的集成方法也带着讲了，细节不啰嗦，刚刚好。

Boosting这块提到了迭代权重更新的逻辑，能帮你理解为啥弱分类器叠起来能变强。AdaBoost这类思路看完就知道怎么调权重了。

错误纠正输出编码（ECOC）蛮有意思的，适合搞多分类问题的时候上手，原理听起来复杂，其实就是转二进制编码，多个二分类器一起上阵。

如果你平时用sklearn或者XGBoost多，理解这些组合方法背后的思路，能帮你调模型的时候少踩坑。尤其是面对高维特征、多噪声数据，用Bagging降方差、Boosting降偏差，是挺实在的选择。

想看更细的实现或代码，可以参考下面这些资源：

如果你刚接触集成学习，可以先从Random Forest练手，思路清晰，调参也友好。