移动轨迹里的老难题——怎么高效找出那些行动轨迹类似的对象对?2013 年这篇《组移动模式挖掘中轨迹聚类的置信区间法》挺有一套。它一上来就定义了个时态距离和平均距离,再结合标准差法和置信区间法做聚类,算得还挺快。适合那种数据量一多就头疼的场景。
置信区间法的用法有点像打个“安全边界”——哪怕轨迹数据有点抖动,它也能稳稳地把类似的对象聚在一块。跟标准差法一起用,效率会更高,适合做轨迹数据预筛选,后面接啥复杂算法都轻松不少。
文章里用了模拟数据和真实数据都做了验证,思路蛮扎实的。你要是做轨迹聚类、位置数据挖掘、或者用到空间数据库的东西,这篇可以当成一套“前置工具”,先把垃圾数据筛一轮,后面就省心多了。
顺带一提,文末还有不少挺实用的资源,比如DBCLASD 聚类、PostgreSQL 空间数据导入、ArcGIS 平台啥的,一起翻翻,说不定哪天就用上了。
如果你手头正好有海量移动对象的数据,可以考虑先用置信区间法做下粗筛,再上更复杂的模型,省资源不说,还稳。