基于数据仓库的数据挖掘综述,算是你做 BI 系统或者搞数据时挺值得一读的文章。

数据仓库的四大特性——面向主题集成性稳定性历史性,其实跟前端的组件化思路有点像,都是为了解耦和清晰结构,方便后续的数据。

它里面讲到的数据流动结构也挺清晰,从数据源监视器集成器再到数据仓库,交给前端展示,思路基本就是后端数据中台的缩影。你在做前端展示时,有时候也要关心这些结构,是跟 BI 图表打交道的时候。

数据挖掘这块提到了关联规则,像“买了面包率还买黄油”这种,就是典型的购物篮。前端搞个可视化,比如用ECharts画个漏斗图或者关系图,就挺直观。

顺带说一句,文末还附了几个延伸资源,像是 协议主题建模数据挖掘与数据仓库 这些,都还蛮实用。

如果你最近刚好在搞数据可视化或者接 BI 系统的接口,不妨看看这个 PDF,了解下数据仓库的套路,对你理解后端给你数据的逻辑有。