Oracle 的这个数据仓库白皮书,写得还挺全的,尤其适合你要系统了解数据仓库整体架构和实践经验的时候翻一翻。开头讲清楚了数据仓库到底是怎么回事,面向主题、数据集成、时间变化、数据稳定这些特性都一一讲透。
说到为啥要用数据仓库,作者也没上来就堆术语,直接举了业务系统分散、数据整合难的例子,还挺贴地气。你在做系统整合或者 BI 项目的时候,看这个部分会有不少启发。
Oracle 方案那段信息量大,ETL、OLAP、数据挖掘一个不少,而且写得比较实在,不是那种浮在空中的。嵌入式 ETL
、OLAP 引擎
、元数据管理
这些都配合例子讲了,逻辑也清晰。
你要是正好在做数据仓库项目,后面那部分最佳实践可以重点看看,从项目规划、实施到优化都覆盖到了。像“明确业务需求”和“数据清洗”这种话听起来基础,但真的在项目里常常被忽视。
的实际案例也不错,尤其是电信和金融行业这两段,看完会更有感,知道这些方案是能真落地的。
如果你准备入坑 Oracle 数据仓库,或者正好负责企业数据整合,不妨把这份白皮书收藏一下,遇到具体问题时翻一翻,多细节能帮你踩少点坑。