内蒙古的风速数据,时间分辨率挺高,有 10 分钟一条的,也有日均的,拿来做时间序列预测还挺合适。数据是打包在几个压缩包里的,结构比较清晰,按区域或时间分得挺细,像698f9f0bca416837032c37881b369a8b.rar
和S201912101023173751700.zip
这种命名就有规律。
风能、发电策略优化、预测模型训练……用场多。尤其是用 LSTM、ARIMA、XGBoost 这些常见的预测算法时,喂进去这种高频数据,效果会好不少。
数据清洗是第一步,缺失值、异常点要小心。不然你模型训得再好,结果也会跑偏。
你要是做风电相关的项目,或者在练时间序列预测模型,这份数据真的可以试试。用pandas
CSV,丢进sklearn
、TensorFlow
都顺手。
如果你还不熟时间序列建模,可以看看这些:
嗯,还有个建议,如果你数据预搞得还不够熟,记得先拿一小段数据练练手,别一上来就整全部。