云计算环境下的知识约简算法,尤其是涉及边界域划分那块,其实挺绕的。但这篇叫《论文研究-云计算下保持边界域划分的知识约简算法研究》的文章,我觉得思路还挺清晰的,适合前期要啃清楚约简概念的你。

边界域的边界在哪里?嗯,这篇就结合了云计算的并行思路来讲,怎么在分布式架构下做知识约简,还能保留边界域结构不变。核心用的其实是布尔矩阵、条件属性、决策类这类比较基础的概念,啃过一次之后理解起来不难。

如果你以前玩过Hadoop、接触过并行属性约简那类优化,读起来更有感觉。我个人比较喜欢它那部分划分规则的,例子虽然不多,但逻辑还算紧凑。有意思的是它后面还提到和医疗大数据结合的应用场景——虽然不是重点讲的,但思路打开了。

对了,顺便还整理了几个配套资源,像那个基于布尔矩阵的约简算法(链接),和空间划分的矩形块算法(链接),都还挺有启发的。你要是刚好在写类似的系统,这几个例子能直接拿来做参考。

建议下载之前准备点草稿纸或者思维导图,边看边记。尤其是算法流程图那里,一不注意就容易绕进去。如果你对数据挖掘也感兴趣,可以看看那个 Web 图数据挖掘的文档(链接),蛮有意思的,跟主文档思路也接得上。