去掉无用属性的小技巧挺实用的,尤其在用 WEKA 做数据挖掘时。像那种ID字段啊,基本就是摆设,对结果没啥。直接在区域 5 勾选id属性,点一下Remove,干脆利落。嗯,记得保存新数据集再打开,不然操作就白费了。

在做模型训练的时候,冗余字段其实会拖后腿,比如你加了个纯唯一标识符,算法还傻乎乎地去学习它的模式,纯浪费算力。清理干净,数据才更干脆,训练速度也能快一截哦。

顺便说下,如果你对属性选择还有兴趣,可以去看看 Weka 里的属性选择工具,里面有不少玩法。就算是新手,按着界面一步步来也不会出错,挺适合用来练手的。