CSV 文件的 R 语言库,真的挺省心的。read.csv()
这个函数算是入门必备,用起来也蛮顺手的。尤其是做数据那会儿,经常碰到 CSV 格式的数据,像财务报表、用户行为日志,全是表格嘛,用 R 导入一把梭。
R 的数据框(data frame)是个实用的结构,你只需要一行代码就能把 CSV 读进来,像下面这样:
data <- read.csv("data.csv")
这一句直接就能把data.csv
里的内容变成一个可以直接的表格对象。后续无论是筛选、聚合,还是画图、建模,都能干。
你要是搞数据,或者用 R 来做机器学习,CSV 格式应该天天见。它通用、轻量、格式也简单,配合 R 的read.csv()
用起来真的挺顺。数据清洗时也不用太纠结,R 的tidyverse
那套配合起来更舒服。
如果你还得跟其他数据库打交道,比如导 CSV 到 MongoDB、MySQL 啥的,也有不少干货资源可以翻翻:
- MongoDB CSV 数据导入指南
- MySQL 数据库导入 CSV 文件的正确方法
- 使用 Shell 脚本批量导入 CSV 数据至 MySQL
- PySpark 高效转换:CSV 文件转 Parquet
嗯,提醒一句:read.csv()
默认把第一行当成表头,如果你的 CSV 没有表头,记得加上header = FALSE
。
如果你经常表格数据,是搞建模的,R 语言的 CSV绝对值得一试。