单一粒度的客户账务信息表,用起来还挺顺的,字段结构清晰,按月度来整理客户的各种费用数据,比如月租费
、短信费
、滞纳金
都一目了然。对做数据仓库
和数据挖掘
建模的你来说,这样的表结构,挺适合直接拿来做维度建模或者聚合的。
字段设计上,客户号码
作为主键字段挺合适,结合月份
字段还能做周期性。所有数据都放在一张表里,起来就比较方便,响应也快,适合跑批量报表或者训练模型时直接读入。你要是用Hive
之类的做,压根不用拆表。
像省内漫游费
、国际漫游费
这些字段,也能让你做出多有意思的,比如用户出差频率、消费偏好之类的标签。嗯,实际业务里,这类数据算是用户画像的重要组成部分了。
不过有一点你得注意,虽然表结构看着简单,但数据量大的时候,单表性能瓶颈还是会有,最好配合分区
字段来,比如按月份
做分区,性能能提升不少。
如果你刚好在做电信
、金融
这类账务类数据项目,这张表你可以拿来直接做数据源,字段够用,也好理解。点这里还能看看相关的挖掘思路。