从数据的碎片到信息的聚合,这篇《从数据到信息-数据仓库概述》讲得还挺清楚的。尤其是你在历史数据、数据一致性这类老大难问题时,看它就挺有感觉。嗯,像贷款只有两年的数据、汇票才 60 天,这种情况你肯定也遇到过吧?文章用实际例子串起来,看的时候你会觉得:啊,原来踩的坑不止我一个人踩过。
历史数据不全、系统不集成,真的是常态。储蓄一套系统、信托一套系统,数据想拼起来?光是数据结构不一致就够折腾一阵了。数据仓库这种东西,就是帮你把这些零零碎碎的东西理顺,变成能说人话的结果。
像那种同义不同名、同名不同义的问题,比如M/F
、Male/Female
这种,小项目还好,大一点系统一多,分分钟让你调不出报表。文章里提到的几个点,比如外部数据、非结构化数据,你平时没太关注,但一旦用上,发现坑还真不少。
如果你是做银行、金融相关业务的,这篇文章蛮推荐你细读的。顺手把这些相关文章也看看,像事务四大特性这种,讲得还蛮通俗易懂。日常开发、系统对接的时候,不少问题都能提前避掉。
,如果你也常常被“数据口径不一致”搞到头秃,或者在做多系统集成时没思路,这篇文章真挺能给你点方向的。