混合模型的离群点检测挺适合搞数据的朋友,尤其是你在那种看起来不太对劲的数据点时,真挺好用的。它的思路也不复杂,就是用几个概率分布来“混着”数据,通过每个点属于哪个分布的概率,来判断它是不是“掉队”的。文中讲得还蛮细,尤其是关于多元正态分布的解释,配上图和例子,看一遍就明白了。