SPSSMODELER2 的数据挖掘流程挺清晰的,从属性选择到数据编码,整个流程安排得蛮科学。你可以直接拿它来跑一些信用卡数据,效果还不错。尤其是那块数据清洗
,对输入错误的方式挺实用,像地址变更啊、拼写错误这些,它都能帮你自动搞定。
属性增强的部分也挺贴心,能让你在已有数据上再加一层,比如说收入水平、是否有车这些,做分类模型的时候更方便。而且编码方式比较人性化,比如把收入除以 1000,起来更直观。
如果你正好在做信用卡评分、客户分群或者是欺诈检测这些场景,那它真的挺合适的。页面不花哨,操作也不绕,适合上手快的朋友。对了,它还支持OLAP
和KDD
流程,不懂也没关系,用几次你就顺了。
你要是想拓展下思路,可以看看这些资料:数据挖掘信用卡应用、基于逻辑回归的信用卡欺诈检测优化,都跟 SPSSMODELER2 的用法蛮对口的。
建议你实际跑个数据集看看,比如那种信用卡流失的数据,或者客户画像的聚类。用起来才知道值不值,如果你是新手,建议从决策树
模型开始,逻辑清晰,结果也容易解释。