数据挖掘的技术和应用算是我最近挺推荐的一份资料,内容讲得还蛮系统的。开头就直接讲清楚了数据挖掘到底干啥的——简单说,就是从一堆数据里扒出有用的信息,帮你少走弯路、做决策更靠谱。
模式识别、统计这些词听着挺吓人,其实你理解成:用各种办法把看不出来的规律给找出来。比如银行用来识别信用卡诈骗、或者电信公司查通话记录找可疑行为,都靠它。
还有一部分讲了蛮多行业应用的例子,像是精准营销、客户细分这些。你要是搞 CRM 系统或者电商平台,这些案例可以给你不少灵感。
有意思的是它还讲了几个常见流程模型,比如SPSS 的 5A 模型
和SAS 的 SEMMA
,看起来有点像项目流程图那味,但其实还挺实用,适合新手参考。
技术和OLAP的对比部分也别错过,一个是验证假设的老实人,一个是自己找规律的侦探型角色——说得通俗点就是这样。
你要是做的是客户关系管理系统,那后面那段内容一定得看看,怎么通过数据找到高价值客户、怎么留住客户,全是干货,讲得清清楚楚。
如果你现在刚好在研究怎么用数据提升用户体验、做用户留存优化,这篇文章的思路挺值得借鉴的,尤其是结合 CRM 部分。