第一代数据挖掘系统的特点是支持少数几个挖掘算法,通常的都是向量数据。这些系统一般一次性把数据加载进内存进行。比如 Salford Systems 的 CART 系统就属于这种类型,它的运行效率蛮高,但也有的局限性。你要是的数据量大,变化频繁,那就需要借助数据库或者数据仓库来做管理了。否则,第一代系统难应对这么复杂的需求。
如果你要用这种系统,记得留意数据规模和变动频率的问题。尤其是对大数据量或者经常更新的数据,第一代系统会显得有点力不从心,反而需要借助一些更复杂的工具来你管理数据,比如SQL 数据库
或者数据仓库
。
,第一代数据挖掘系统在小规模、稳定的数据集时,还是合适的,快速上手的优点也挺。就看你需要的场景是不是适配了这种简单高效的系统。