数据仓库的三层架构思路挺清晰的,抽取、管理、一条龙搞定,适合银行这种数据量爆炸的业务场景。ETL 那块讲得蛮细,尤其是增量更新和调度监控,做得不好的话,光是数据同步就能把你拖死。
数据存储用了经典的ODS-DW
二层结构,支持多维,查询也快,像Oracle
、Teradata
这些老牌数据库都在用这套思路。主题清晰、数据稳定,做 BI 再合适不过了。
和展示层用了OLAP
和数据挖掘配合,像SAS
那套行为计分和申计分机制,用数学模型动态调整授信额度,还能找出高价值用户,这操作可以说是“懂业务+懂技术”的典范。
工具方面也挺全,ETL 有Informatica
、DataStage
;这块有Business Objects
、Cognos
;挖掘用SAS
、SPSS
也都不错。如果你也在搞金融数据仓库,这些工具值得一试。
想深入挖的,可以看看下面这些文章,讲得还挺细:数据仓库、OLAP 和数据挖掘技术指南、数据仓库与 OLAP 概述这两篇比较推荐。