MATLAB 里的Chisquaretests功能蛮实用,适合统计里那些分类数据的均匀性或独立性检验。脚本通常封装得比较完整,像chi2Tests.m里头就集成了克雷西检验皮尔逊卡方检验对数概率检验,你只要准备好数据,直接调用函数就行,响应也快,结果清晰。

三种检验方式用法不太一样。皮尔逊最常见,适合看两个变量是不是互相关联,比如“性别和职业有没有关系”;Cressie-Read比较适合多分类、不太平衡的数据集;LRT就偏模型层面,像比较两个模型谁更适合数据。嗯,选择哪个得看你的数据长啥样。

输入数据一般要整理成矩阵形式,每行每列表示不同的分类,像交叉表那样,单元格里填的是两个变量同时出现的次数。调用脚本之后,会输出卡方值、自由度还有 p 值,拿着这些就能判断要不要拒绝原假设了。一般p < 0>就变量间的关系不是巧合。

文件里应该还带了license.txt,用之前最好瞄一眼,看看能不能改代码或者用于项目中。哦对了,如果你想搞清楚卡方检验背后的理论或者找点例子,可以去看看下面那几个链接,挺有的。

如果你经常用 MATLAB 做数据、尤其是分类数据,Chisquaretests真是个不错的小工具。懒得手撸统计检验过程的,直接上这个就对了。