基于数据挖掘的入侵检测模型,挺适合搞安全方向的你参考一下。2006 年的文章,虽然年代久了点,但思路还挺有代表性。它讲的是怎么用数据挖掘技术,从一堆系统行为数据里自动找出关键特征,生成检测规则,识别出 DDoS 这种常见攻击。

模型的核心思路,是通过数据挖掘搞定特征提取模式识别,实现一个自适应入侵检测流程。你不用手动去写规则,系统能自己学。说白了就是偷懒利器,效率高得多,尤其在大规模日志数据时挺好用。

想深入点的可以去看看这几个资源:入侵检测中的数据挖掘流程这篇讲得比较细;还有这个pymfe工具,搞 Python 特征提取还挺顺手;再配上PCA 特征提取代码,组合拳打起来效果更稳。

对了,用 Matlab 的同学别错过下面这几个:

如果你也在折腾入侵检测系统,或者搞大数据,不妨用这些资源练练手。尤其是结合实际日志去测试,会有不少新发现。