企业级数据仓库的实现方式,挺推荐你从部门级的数据集市慢慢入手,一点点往上扩。比如先搞定销售数据,再加上财务、人力的,慢慢就成了全企业的大仓库。思路清晰,实施起来也更有章法,不至于一上来就乱套。

你要是刚上手,强烈建议先看看联合型数据仓库的架构,参考这篇联合型数据仓库与数据集市架构综述》,对概念的理解挺有。

还有啊,数据仓库数据集市到底差在哪?新手最容易搞混,直接看这篇数据仓库与数据集市的区别及入门指南》,通俗易懂。

你要动手搭建,SQL Server也还不错,尤其 2008 版本的教程,比较系统,配合实际数据集来讲,链接在这儿《SQL_Server_2008 基础教程》,还挺适合初学者。

哦对了,建模方法别忽视。信用卡的数据集市案例就挺实战的,尤其是维度模型部分,可以参考信用卡数据集市的建模方法论》。

如果你考虑用大数据技术落地,比如Spark + ClickHouse,那这篇《Spark+ClickHouse 企业级数据仓库教程》挺有参考价值,讲得细也不啰嗦。

别忘了,数据仓库搭起来之后,数据挖掘这块就能发挥威力了,想搞点模型或者预测的应用,可以从数据仓库与数据挖掘》开始,打基础刚刚好。

如果你正要搞企业级数据,慢慢摸索这些内容,会让你事半功倍。