通话记录的模拟生成工具,BigData0323.zip 真挺方便的。

日志数据的生产脚本,不需要配置什么全局文件,直接跑就行,逻辑比较清晰。它的思路就是:从通讯录里挑俩号码,一个当主叫,一个被叫,搞个通话时间,再配个通话时长,整成一条通话记录写进日志文件。

数据文件的落地方式挺干脆,直接刷写到本地文本中。你可以拿这份数据去做后续的流、之类的活,比如喂给Flink算通话时长,或者做个实时大屏展示。

通讯录的读取方式也挺灵活,就是一个数据读取,从文件中读入联系人信息。你可以把这部分换成数据库、API 啥的都行,接口清晰。

通话记录的生成过程里还加了点随机逻辑,比如主叫被叫随机挑,通话时间也随机搞一搞,生成的数据比较接近真实场景,不会太死板。

,这资源适合用来做数据模拟、日志采集、初步数据流转练习,用在大数据入门项目上合适。如果你刚接触数据链路构建,这个资源可以帮你走一遍流程。

如果你想继续深入,比如统计通话时长、接入流框架,可以看看这个Flink 通话时长统计,配合着用效果更好。