R 语言的性统计功能还挺全的,尤其是刚开始数据的时候,用起来顺手又直观。像summary()
、mean()
、sd()
这些基本函数就不多说了,简单直接,适合先快速看个。
summary()函数的整体表现还不错,常跟str()
搭配着用,能快速把数据结构和数值分布摸清楚。你也可以自定义一些函数,比如求中位数、分位数啥的,写几行代码就搞定。
分组统计也蛮方便的,用aggregate()
或者dplyr::group_by()
配合summarise()
,能轻松分类变量。比如你想看不同性别的平均收入,用个group_by(sex) %>% summarise(mean(income))
就出来了,效率挺高。
数据可视化这一块,配合ggplot2那就更舒服了。柱状图、箱线图、密度图,全都能上,还能自定义样式,适合稍微讲究点的展示。如果你对可视化还不熟,可以看看R 语言数据可视化与统计建模这篇文章,讲得挺系统的。
想再深入一点的,还可以看看性统计计算指南,里面的例子比较实用;或者多元统计与图标可视化技术,适合做复杂的时候参考一下。
,R 在性统计这块,基础工具多、扩展也灵活,新手上手快,老手拓展强。嗯,如果你正准备啃一波数据,拿 R 开刀是个不错的选择。