能耗数据的五年采集记录,周期还挺细的,15 分钟一条,数据量扎实。12 月份的整月数据已经整理好了,你直接能在addtagdata.txt里看到类似MT_001:0;MT_002:5这样的键值对。原始日志放在data.log,有点杂,但灵活性高,你想啥自己拉数据就行。

文件格式还挺人性化的,起来蛮顺手的,用Pandas做个数据透视表、折线图啥的也方便。其实要你想把这些做个 MySQL 存储,再定期,也是没啥压力。

我还顺手翻了几个周边资料,像是MySQL的快速入门,还有R 语言MATLAB那边做采样周期的内容,基本能搭配着来,节省不少时间。

数据过程中记得对异常点做下,比如后面几条MT_370:3837这种,跳跃太大,是设备冲突或者采集误差,别忘了预哦。

如果你打算做个能耗预测模型,这套数据集还蛮适合练手的。尤其适合做短周期趋势预测那一类任务。采样密度高、时间跨度长,挺能锻炼算法的鲁棒性。

对了,如果你还不熟Pandas,推荐你先看这个:钟学习 Pandas 简介。顺手你也可以把数据存进 MySQL,搭个小后台玩玩,参考21 分钟学习 MySQL 基础教程也快上手。

别忘了,data.log是原始数据,结构没那么规整,你得稍微下。实在想省事,也可以先看下MATLAB 开发实时视觉控制系统的最大采样周期,看人家是怎么做周期对齐和异常剔除的。