C++写的CART 分类和回归树实现,结构清晰、代码不啰嗦,挺适合拿来学习算法或者搞个项目原型的。

源码目录规整,数据格式要求也不复杂。训练数据和测试数据都用一种类似label feature:value的方式,特征值如果是 0 就干脆不写,省空间也快不少。嗯,挺合理。

标签从 1 开始编号,比如 4 类问题,就用 1、2、3、4。特征 ID 也得升序排,像1:0.3 3:0.5 7:0.1这样,不然读取会出问题。适合你自己生成数据喂模型,也方便测试。

回归和分类都能搞定,写法偏底层,适合熟悉算法逻辑。你想看 C++里怎么实现二叉树分裂、Gini 系数这些,那这套代码还挺不错的。

还有几个相关资料也蛮有用的,比如CART 算法在数据挖掘中的应用研究,讲得比较系统。你也可以对比看看另一个 C++的决策树实现,思路不太一样。

如果你最近正好在写 C++项目,想集成一个简单决策树模块,或者纯粹想看看 C++实现的数据挖掘算法,那可以试试这个资源。简单改一改就能用。