SPSS 的原生格式.sav
配合.xlsx
版本,一起打包在SPSS 数据.zip
里,挺适合跨平台的数据练手的。
sav 文件的好处是能保存完整变量信息,像变量标签、数值这些,SPSS 里打开后清清楚楚,变量之间的逻辑也一目了然。
Excel 版本也放进去了,兼容性比较好。你用 Python 的pandas
或 R 的readxl
都能直接读,适合那些不熟 SPSS 但常用脚本语言数据的同学。
像你要做性统计
、回归
或聚类
这种,数据预是第一步——缺失值、异常值都得先搞定。SPSS 界面直观,适合小白上手;用 Python 或 R,灵活性更强,适合自动化批。
文件不大,结构清晰,不管是要在教学上做案例,还是要拿来练pandas
的groupby
和merge
,都还挺合适的。如果你平时数据用得多,建议两个格式都熟练掌握,互转也不复杂。
对了,如果你想复习一下 Excel 和 SPSS 的基础操作,可以看看这两个教程:
,这个压缩包算是数据上手不错的一份素材,别错过。