CRISP-DM 的数据挖掘流程一直挺经典的,py-crisp就是在这个思路上做的一个小而美的项目模板。文件结构清晰,逻辑也比较顺,适合你拿来就开搞,少了多搭架子的麻烦。cookiecutter一键生成,省事不少。

模板默认你是用Anaconda做环境管理的,这点挺贴心。不过如果你用的是别的环境,那就老老实实自己配requirements.txt吧,灵活是够灵活的。想了解更多 CRISP-DM 背后的理论?可以看看下面那几个资料,还挺有参考价值的。

安装流程也简单:pip install cookiecutter装个工具,一句cookiecutter https://github.com/ruffyleaf/py-crisp.git就能把整个项目脚手架拉下来。目录结构直接参考了 CRISP-DM 的六大步骤,拿来做教学演示也蛮不错。

如果你平时项目都在 Anaconda 里跑,那这个模板真的挺省事。如果你喜欢从干净环境开始配置,那也别忘了把自己的环境依赖整理成requirements.txt,不续维护挺麻烦的。