数据仓库项目的生命周期规划工具,选 Ralph Kimball 这本《数据仓库生命周期工具箱(第 2 版)》还蛮靠谱的。方法是老的,但实用性依然在线,挺多公司现在还在按这套来走。

从建模到上线的流程都讲得比较细,像怎么设计 ETL 流程、怎么搞数据集市,都有现成的模板可以套。对团队协作也有多建议,尤其适合第一次做 DW/BI 项目的你。

Kimball 方法论在圈里早就是老网红了。从 1998 年第一版开始就火到现在,基本大厂小厂都绕不开。它推的维度建模,多 BI 工具像 Power BI、Tableau、Looker 其实都是按这个思路来的。

嗯,书不算薄,但内容还蛮扎实的,建议你配着项目慢慢看。尤其是开发初期,先翻翻指标规划和数据治理那几章,会比较有方向感。

如果你正准备搞一个全生命周期管理的 DW 系统,可以顺手看看这些相关文章:

对了,开发时别忘了注重数据质量,别光跑得快,图表一堆脏数据可就尴尬了。