基于云平台的数据挖掘架构,挺适合做中大型数据的项目。用了分布式存储和并行计算,响应快、扩展性也强。文章里提到的架构设计还蛮贴合当前主流需求,尤其在数据量一上来时,优势就了。

如果你之前折腾过 Hadoop、Spark 那一套,会觉得思路挺熟悉。但这篇写得更系统一些,像调度机制、任务分发都有细讲,细节还挺到位。整体更像是把云计算跟数据挖掘打通了,做平台的朋友可以重点看看。

除了主文,还有几个关联资源也值得翻:像智能手机数据挖掘平台那篇,思路跟本文挺搭;再比如Hadoop 详解,补基础用刚好;还有美团大数据平台实战,干货不少。

如果你正考虑搭个数据挖掘平台,又不想从零起步,可以先看看这篇,借点思路。嗯,资源还算比较全,就是页面有点老,打开慢点。