个例数据设置的操作思路挺清晰,SPSS-Clementine结合用起来还不错。像个例数据源个例数据类型这些字段,灵活改改就能跑各种小型测试。嗯,做数据挖掘原理学习或者跑个原型,比较省事。

字段配置也简单,别小看个例数据项目,多人喜欢一次性塞一堆变量进去,结果跑不动。推荐先丢个小样本,试试模型输出,再慢慢加量,效率高多了。

想摸清思路的话,可以先看下SPSS 与 Clementine 数据挖掘初探这篇文章,讲得蛮基础,适合上手。SPSS配合Clementine,做客户分类、市场细分还蛮好用。

如果你刚开始玩数据挖掘,记得把个例数据文件保存好,最好分阶段备份,要不模型一多改起来挺头疼。