电信行业的数据,一向又多又杂,想挖点干货出来真不容易。DMS 电信通用数据挖掘系统论文就专门聊了这个事,讲得挺细也挺实用,适合你想搞清楚怎么把数据挖掘真正落地做成系统的。嗯,里面不光有理论,还带了项目实践的内容,跟着写代码那种,落地性还不错。
论文走的是软件工程思路,从需求一路讲到模型训练,流程清晰,适合做参考。像什么数据预、特征选择、聚类、分类这几步,写得挺接地气的,多地方还有代码实现建议,挺贴心。
实际场景也有,比如用户流失预测、网络优化、个性化推荐这些,都是电信里用得着的。用什么工具、踩过哪些坑,也都有提,蛮有借鉴价值。
要是你最近正好在搞电信相关的数据项目,或者对如何用Python、WEKA之类工具做挖掘感兴趣,这份论文你可以看看。顺手一提,配套文档是DMS 电信数据挖掘系统论文 11.doc
,可以直接拿来研究研究。
对了,想深入了解关联规则和聚类算法?下面几个链接也别错过: - 关联规则挖掘数据挖掘中的关联规则 - 聚类与距离度量数据挖掘关联规则 - 挖掘多层关联规则
如果你刚好在做数据挖掘相关项目,是面向行业落地的那种,这篇论文的思路和经验,应该能帮你少走不少弯路。