Flink 通话时长统计

通话记录生成模拟工具

该程序能自动生成通话记录，包括主叫、被叫、通话日期和时间。

Hadoop 16 2024-07-13

SQLite通话记录数据模拟示例

通话记录的数据模拟挺常见的，尤其你在做数据、日志或者搞点 Flink 流计算时，手上没点靠谱的数据资源还真有点抓瞎。calls 表的数据结构比较简单，但信息量不小，像number记录号码，date是 Unix 时间戳，type还能区分来电去电，模拟真实通话场景还是蛮到位的。有意思的是，它用的是SQLite，轻量又方便，测试用起来毫无压力。如果你用Flink来跑通话时长的聚合，直接喂这张表就合适。没 SQLite 驱动也好说，Python 配合sqlite3模块，分分钟就能跑起来。你还可以结合通话记录生成模拟工具或者BigData 日志生成器扩展数据量。测试多线程或者Kafka入流之前先造点

SQLite 0 2025-06-14

BigData 0323通话日志生成工具

通话记录的模拟生成工具，BigData0323.zip 真挺方便的。日志数据的生产脚本，不需要配置什么全局文件，直接跑就行，逻辑比较清晰。它的思路就是：从通讯录里挑俩号码，一个当主叫，一个被叫，搞个通话时间，再配个通话时长，整成一条通话记录写进日志文件。数据文件的落地方式挺干脆，直接刷写到本地文本中。你可以拿这份数据去做后续的流、之类的活，比如喂给Flink算通话时长，或者做个实时大屏展示。通讯录的读取方式也挺灵活，就是一个数据读取，从文件中读入联系人信息。你可以把这部分换成数据库、API 啥的都行，接口清晰。通话记录的生成过程里还加了点随机逻辑，比如主叫被叫随机挑，通话时间也随机搞一

Hbase 0 2025-06-13

Spark电信通话数据实战项目

企业级项目里的Spark实战资源，还是挺值得一看的。Spark 电信电话项目用的是百度云数据，模拟的是电信业务场景，像用户通话记录、活跃用户行为追踪这些，都能跑得起来。你要是正好在啃Spark，又想搞点偏实际的练手项目，这套资源就蛮合适。数据的落地，不只是跑个模型、写几行RDD就完事了。这里整合了百度云上的真实数据，模拟真实业务流程，从数据预、转换到，流程比较全，逻辑也清楚。响应也快，适合跑在自己机器上调试。相关的一些技术资源也能用上，比如想搞清楚Hadoop和Spark怎么联动，或者百度热搜的数据方式，可以参考这篇：基于 Hadoop 和 Spark 的百度热搜数据可视化系统设计与实现。

spark 0 2025-06-15

分时长行程数与出险率关系分析

时长变异系数：行程时长变异系数反映行程时长差异程度，但对出险率影响不明显。分时长行程数：- 0-30分钟行程占比升高，出险率降低。- 30分钟以上行程占比升高，出险率上升。根据细分结果，构建“30分钟以上行程数量占比”指标，用于预测模型。

算法与数据结构 22 2024-05-12

精通Apache Flink，学习Apache Flink

根据所提供的文档内容，可以了解以下信息：1. Apache Flink简介：Apache Flink是一个开源的流处理框架，支持高吞吐量、低延迟的数据处理，具备容错机制，确保数据处理的准确性。Flink的架构包括Job Manager负责任务调度和协调，Task Manager执行任务。它支持状态管理和检查点机制，实现“恰好一次”状态计算。此外，Flink提供了窗口操作来处理滑动、滚动和会话窗口，以及灵活的内存管理。Flink还包含优化器，同时支持流处理和批处理。2. 快速入门设置：了解Flink的安装和配置步骤，包括在Windows和Linux系统上的安装，配置SSH、Java和Flink，

flink 13 2024-08-21

行程时长分布分析-GPS信号捕获算法Matlab/Simulink仿真

（3）行程时长分布图 3为行程时长分布图，从图中可知很多行程均为短行程，其中行程时长大于5分钟且小于10分钟的占比最高，这种现象产生的原因与里程较短的原因类似。超过75%的行程，时长不超过30分钟，这可能与实际用车场景是吻合的。同时部分行程的时长为零，对于这种行程需要剔除。这种不确定性和主观性，短行程的出现更多的可能是由于底层数据机制的问题所导致的。从图中可发现，部分行程的里程为零，对于此类行程应予以剔除。

算法与数据结构 6 2024-11-06

电信业数据挖掘各组通话行为强弱比较

各组通话行为的强弱特征整理，做得还挺细的，适合搞电信用户的朋友参考一下。像组 1“低使用率组”跟 10086 打得多，但用得不广；组 4“联通联系紧密组”光看名字就懂，有联通用户通话偏好。嗯，标签分得清楚，强弱势也标得挺明白。你如果要做用户画像或者行为分类，这份 PPT 可以直接拿来参考建模特征。

数据挖掘 0 2025-06-15

Flink状态管理详解

详细讲解Flink核心实例中的状态管理机制及其代码实现。通过深入分析，揭示了Flink在大数据处理中状态管理的关键作用和应用场景。

flink 12 2024-07-18