数据仓库的压缩知识包,挺适合做银行系统的同学快速过一遍核心概念。像 ETL、OLAP、数据挖掘这些老朋友全都涵盖了,讲得也蛮系统。结构是按三层逻辑来拆的,从数据怎么抽取、怎么存储,到怎么展现。内容还穿插了实际案例,比如广发银行怎么用 SAS 做信用评分,这种就挺接地气。

数据的抽取层,重点是 ETL——抽、转、载,技术细节还不少。像增量更新、调度监控啥的,讲得比较清楚。你要做批、同步数据,那部分可以反复看几遍。

存储和管理这块,用的是ODS-DW的二层架构。ODS 偏近实时,DW 偏,结构清晰,方便你做后续的主题建模。数据的四大特性也有讲,像面向主题不可删改这些,做银行类系统要注意合规要求。

和展现层就比较“炫技”了,OLAP 和数据挖掘都提到了。尤其数据挖掘那块,用了多 BI 产品,像SAS、SPSS、IBM这些,不少老银行现在还在用。里面提到广发用 SAS 做信用卡用户行为,场景就挺实用的。

工具方面也给了一堆推荐:Informatica、Datastage搞 ETL,Oracle、Teradata做 DW,Cognos、BO搞 OLAP。嗯,都是些比较稳的老牌产品,用来熟悉架构合适。

如果你是搞金融系统、是银行类系统的前端或数据中台开发,建议先扫一遍这个压缩版,心里会有底。顺手把下面这些资料一起收藏了,查缺补漏用得上:

哦对了,如果你在搞BI 可视化或者配合后端数据平台对接,这些知识点也蛮有的,别只盯着页面交互。