来自圣保罗医院的 COVID-19 匿名诊疗数据,挺适合做疫情或者机器学习建模的练手项目。RT-PCR 检测的数据也有,而且所有数值都已经标准化过了,拿来直接喂模型也方便。数据清洗这块能省不少事。
数据里的临床检测项还挺丰富,像血象、肝功能、电解质那些全都有,字段命名也清晰,看着不费劲。你要是想做分类模型,比如预测阳性还是阴性,这套数据就挺合适的。
还有一点不错的,所有信息都匿名过,不用太担心隐私问题,直接本地跑就行。如果你想搭配点别的数据练练多源融合,可以顺手看看下面这几个:
- COVID-19 患者的 miRNA 谱数据,做生信挺方便
- MATLAB 模拟 PCR 过程,配合理解实验逻辑
- 关于匿名数据的隐私挑战,想往隐私计算方向走的别错过
如果你正准备做个医疗方向的 AI 小项目,或者想练练数据预的流程,这份数据蛮不错的。量不大,字段全,响应也快。嗯,记得先看看字段含义和标准化细节,有些值要还原一下才好理解。