基于数据仓库的数据挖掘综述,算是你做 BI 系统或者搞数据时挺值得一读的文章。
数据仓库的四大特性——面向主题、集成性、稳定性、历史性,其实跟前端的组件化思路有点像,都是为了解耦和清晰结构,方便后续的数据。
它里面讲到的数据流动结构也挺清晰,从数据源到监视器、集成器再到数据仓库,交给前端展示,思路基本就是后端数据中台的缩影。你在做前端展示时,有时候也要关心这些结构,是跟 BI 图表打交道的时候。
数据挖掘这块提到了关联规则,像“买了面包率还买黄油”这种,就是典型的购物篮。前端搞个可视化,比如用ECharts
画个漏斗图或者关系图,就挺直观。
顺带说一句,文末还附了几个延伸资源,像是 协议主题建模 和 数据挖掘与数据仓库 这些,都还蛮实用。
如果你最近刚好在搞数据可视化或者接 BI 系统的接口,不妨看看这个 PDF,了解下数据仓库的套路,对你理解后端给你数据的逻辑有。