MTS 数据挖掘的后续研究点,写得还挺深入的,尤其提到用Hotelling T²成本函数做异常检测这块,蛮有意思。你要是对时间序列异常识别感兴趣,这篇内容值得你花点时间看看,尤其是想搞明白什么是不和谐子序列、例外模式的本质区别。
异常识别的部分讲得比较细,像是第 2 章直接上了股票交易的数据做例子,对比第 4 章挖出来的“不和谐子序列”,思路清晰,操作性也强。如果你平时也用Python做数据,那和Python-STUMPY结合用,说不定就有思路了。
另外它还提到一个点我觉得挺实用——就是在线实时检测的想法,现在不是多项目都走实时数据吗?这思路正好切合,比如用在金融、智能监控系统里,效果会比较直观。你也可以顺便看看运动模式识别那篇文章,对行为异常检测也有。
哦对了,如果你之前接触过 T²分布,那你会对这篇 MRI 优化方法也有点兴趣,虽然是医疗领域的,但思路其实互通。对多维时间序列这块感兴趣的话,可以再翻翻序列模式那篇文章,有些想法还挺新鲜的。
呢,如果你最近在搞时间序列挖掘,尤其关注异常检测方向,这份红皮书风格的文档看下来绝对能给你不少灵感。顺便记得多关注数据源质量问题,可以看看这个数据源识别策略的文章,对构建训练集蛮有参考价值。
如果你在做实时 MTS,可以试着把异常检测流程搭配STUMPY
用起来,响应也快,代码也简单。