数据挖掘里的 CRISP-DM 流程标准,挺适合做项目流程梳理的。你要是经常跑模型、做特征,用上 PMML 标准会方便不少,模型在不同平台之间切换,基本不用重写代码。像SOAP这种协议,虽然老,但对接一些老系统还挺常见的。嗯,还有OLE DB for Data Mining,做数据库互操作性的时候蛮有用的,尤其是搞 SAS 或 IBM 数据源的朋友,应该知道它有多省事。