IVR 客户的行为太难猜?你可以看看这篇研究,研究者用数据挖掘给呼叫中心做了个“客户画像”。CRISP-DW 流程打底,Clementine 工具数据,先清洗,再聚类,建了个C5.0 决策树模型,整个链条走得挺完整。比如你能发现,ARPU 值在 100~150 之间的客户,更容易走进 IVR 系统,像福田、宝安这些地区也集中不少这样的用户。

模型跑出来的结果蛮有意思,客户入 IVR 的原因还真不少,像需求复杂、接入时长、地区差异等等。用C5.0来预测这些特征,不光快,精度也还不错。

而且聚类的逻辑挺实用,按ARPU 值入网时长划成四类客户,你就能更清楚:哪些人更愿意用自动语音,哪些人宁可人工排队。对电信客服优化 IVR 路径设计,这直接能拿来参考。

数据预也不含糊,像离散化去重这些步骤都做了,挺贴合做前端时要先搞干净数据的思路。嗯,如果你也在做和用户行为呼叫中心优化相关的东西,这篇研究资料值得收藏一下。

顺便推荐几个延伸阅读,像决策树课程设计中的算法应用这些文章,搭配着看更有感觉。