ID3经典算法信息增益决策树

ID3 算法的总结挺实用的，尤其是它按信息增益来选特征这一点，逻辑清晰，适合初学者理解。整套流程也不复杂：从计算每个属性的信息增益开始，一步步选出最佳划分点，递归建树。说白了，谁的信息量大就用谁，简单粗暴但效果不错。

ID3 的核心是信息熵，多人刚接触的时候觉得抽象，其实就跟日常挑人问话一样——哪个问题最能缩小范围，你就先问哪个。比如在一个数据集中，属性 A划分后能迅速把正负样本分开，那它的信息增益就高。

这套资料里，不光讲了理论，还有几个配套链接比较有意思，比如ID3 算法的程序实现，用 Java 写的逻辑也蛮清楚，适合你参考下结构。如果你喜欢把玩可视化，那个用 MATLAB 搞鸢尾花数据集的例子也值得看，决策树长什么样一目了然。

另外，像信息增益率、MapReduce 并行也顺带提了一下，想往更高级的方向走，这些链接也挺有用。

如果你最近正想搞明白决策树怎么选属性、怎么停下递归，不妨花几分钟看看这篇总结，顺手点几个链接，思路就清晰多了。