如果你最近在搞分布式数据挖掘,尤其是像频繁闭合模式这类问题的研究,基于元学习的分布式挖掘频繁闭合模式算法这篇论文绝对值得看看。它讨论了一些比较实用的算法优化,尤其在分布式环境下的高效实现。其实,多分布式系统的算法都离不开像Hadoop、Storm这些基础设施,而这些内容在相关文献里也有提到。如果你对分布式算法、数据挖掘感兴趣,深入理解这些内容绝对能帮你提升多技术水平。
推荐阅读一些相关资源,比如频繁模式挖掘算法和分布式医疗数据挖掘这些文章,也能给你带来更多的灵感。如果你有时间的话,还可以深入研究Redis的分布式锁,或者搞搞AprTidRec之类的分布式关联规则挖掘,挺有意思的。