知识背景的序列模型和时间序列模型,经常让人傻傻分不清。其实还挺好区分的。序列模型主要是一串行为的顺序,比如用户买了 A 又买 B,再买 C——这种叫行为路径挖掘;而时间序列模型更像是盯着一个指标随时间变动的走势,比如股票价格、温度变化那类有时间自相关的事。
想挖点干货?这几个资源还蛮值得一看:ARMA 模型那个不错,直接上了Python 代码,方便你边看边跑。还有个叫resampleX的工具,专门搞时间序列重采样,数据挺顺手。
如果你喜欢用MATLAB或SAS做,也有现成的教程和代码,比如MATLAB 时间序列和SAS 时间序列。嗯,页面风格有点老,不过内容挺实用的。
还有一点要注意,时间序列的建模,比如AR或ARMA,你得先搞清楚ACF、PACF这些基础概念,不然拟合出来的模型全是噪音。可以直接戳这里看下ACF/PACF 代码实现。
如果你刚入门,建议先从时间序列预测法或股票时间序列教程看看,例子简单直观,上手快。
还有个有趣的点,PostgreSQL现在也能搞时间序列扩展了,适合你做数据存储 + 查询一体化,可以点这看个实例:PostgreSQL Extension 时间序列扩展。
,如果你经常跟数据打交道,不管是行为模式还是时间趋势预测,收藏一波这些工具和代码,早晚用得上。