数据仓库与数据挖掘的论文和文献,内容还蛮全的,适合搞大数据的同学收藏一波。讲了不少实战用得上的东西,比如怎么用SQLNoSQL海量数据,怎么选特征,怎么挖掘模式这些,讲得挺接地气。里面还带了案例,比如零售、电商、医疗这些场景,看完脑子里会更有画面感。
要说亮点,我觉得是数据流程讲得比较细,从聚类分类再到关联规则,整个流程串得挺顺。是像AprioriK-means这些,直接点出使用方法和优缺点,省得你到处找资料。
如果你是刚上手数据挖掘,或者做项目时有点懵,这批资料还蛮靠谱的,能帮你把底子打扎实。
对了,隐私和合规也提了一下,比如GDPR和数据脱敏,不然用户数据可是要踩坑的。
如果你平时搞 ETL 流程、建模型、做 BI,那这个文献集合你可以先存着,有空细看,踩坑少点。