这份数据集由美国国家癌症研究所支持的多中心血友病队列研究获得,涵盖了1978年1月1日至1995年12月31日在16个治疗中心追踪的1600多名血友病患者。数据总共包含2144个观测值和6个变量,其中包括描述HIV状况、凝血因子制剂使用剂量、日历年、年龄和参与研究时间等信息。
美国国家癌症研究所资助的血友病多中心队列研究数据集
相关推荐
AR、ORL和Stanford数据集人脸识别研究数据集
AR 和 ORL 与 Stanford 数据集是人脸识别领域比较常用的几个数据集。Stanford 数据集包含 200 张男性和 200 张女性人脸图像,光照和姿态都差不多,分辨率为 200×200,正面图像为主,分为训练集和测试集,图像格式为.jpg。而 ORL 数据集是 40 个人的面部图像,10 张,格式是.pgm。此外,AR 数据集有 2600 张图像,男女不分文件夹,文件格式也是.pgm。总体来说,这些数据集对人脸识别的测试和研究挺有的。如果你做人脸识别相关的项目,使用这些数据集可以轻松搞定数据准备工作,节省多时间哦。
算法与数据结构
0
2025-07-01
层次分析matlab代码的软件改进——马克斯·普朗克钢铁研究所的创新
层次分析matlab代码,由马克斯·普朗克科学研究所开发,专为GB丛集设计。该软件集成了ClusterGB Python脚本,通过LAMMPS进行大规模原子/分子并行模拟,特别适用于平面晶界,克服周期性边界条件。此外,与DAMASK软件套件相比,GB代码还引入了深海森堡的机器学习算法和原子探针技术,用于晶界跟踪和晶体学索引。
Matlab
12
2024-09-21
MovieLens 10M 数据集应用研究
MovieLens 10M 数据集是一个广泛应用于推荐系统研究的公开数据集,包含了大量的用户对电影的评分数据。 该数据集可以用于探索和评估不同的推荐算法,例如协同过滤、基于内容的推荐等,推动推荐系统性能的提升。此外,MovieLens 10M 数据集还可以应用于其他数据挖掘任务,例如用户行为分析、电影流行度预测等,具有广泛的应用价值。
算法与数据结构
15
2024-06-22
Diabetes Dataset糖尿病回归数据集
糖尿病研究里的经典老朋友——Diabetes Dataset,你已经听过好几次了,但它真的是个适合做神经网络和深度学习练手的数据集。442 位患者的真实记录,包含10 个生理特征,像age、bmi、bp这些都比较常见,关键是还有一年后的血糖水平做目标值,直接用来做回归,简直不要太方便。模型搭建也挺灵活的,前馈神经网络能用,玩点花的也可以整CNN、RNN,甚至搞个集成学习来点多任务预测都不难。你要是图快,可以用sklearn.datasets.load_diabetes直接导入,起来顺手。但注意哦,用之前最好做点预,像标准化、异常值啥的,该做还是要做。不然一上来就训练,模型肯定不给你好脸色。还可
算法与数据结构
0
2025-06-25
Country全球国家省份数据集
嗯,country.sql这份资源适合跨境电商和开发者使用,包含了两百多个国家和四千多个省份的数据。想做国际化的项目或者需要国家、省份相关信息的应用,这份数据绝对能帮你省不少事。尤其是跨境电商,能用它直接对接全球市场,比较方便。数据全,信息比较准确,基本涵盖了全球的地理分布。你在做电商开发时,会常常遇到这种需求,这时候就可以用到它。总体来说,挺好用的,推荐给你!
此外,这里有些相关的资源,也挺适合你的项目:
1. Tianchi AntaiCup 跨境电商推荐算法方案
2. 全球城市-省份/州-国家数据表.sql
3. 全球国家省份州城市四级数据详解洲、国家、州/省、城市
4. 全球国家省份城
MySQL
0
2025-06-25
旁遮普蚊媒病流行病学研究
旁遮普邦的疟疾、登革热和基孔肯雅热流行病学趋势分析显示:
疟疾:农村为主,Mansa和Bathinda流行最严重。
登革热:Patiala、Ludhiana和SAS Nagar流行最严重。
基孔肯雅热:SAS Nagar流行最严重。
特点:- 男性感染率高于女性。- 疟疾集中在8-9月,登革热在7-11月,基孔肯雅热在8-10月。
意义:- 趋势分析有助于关注流行地区和加强病媒控制。- 加强昆虫学监测、减少病媒繁殖和提高社区意识可有效控制疾病传播。
统计分析
16
2024-04-30
Hadoop美国出生人口测试数据集
hadoop 测试的出生人口数据,算是我测试 MapReduce 性能时候用得比较多的一套。按年份拆分,每年一个yobXXXX.txt文件,从 1885 到 2016 都有,适合做点时间序列或者人口趋势可视化,格式也比较简单,CSV 文本,解析起来不麻烦。数据蛮适合拿来跑 MapReduce 任务的,文件够多、体量适中,放在 HDFS 里分块效果挺直观。你要测 IO、测试Mapper/Reducer逻辑效率,这套数据拿来直接跑一跑就行,响应也快。我自己平时还会配合Hive或者Pig来试试查询语句的优化,也试过用Spark做个小 demo,批量效率还不错。你甚至可以接个Tableau或者Graf
Hadoop
0
2025-06-24
Matlab脚本图宾根医学心理学研究所常用的C4.5代码
Matlab脚本:图宾根医学心理学研究所常用的C4.5代码。这些脚本包括事件检测器和用于检测实地考察数据结构中主轴和慢速振荡的功能。示例代码如下:cfg = []; cfg.scoring = scoring; cfg.scoring_epoch_length = 30; cfg.code_NREM = [2 3 4]; cfg.code_REM = 5; cfg.code_WAKE = 0; cfg.spi_dur_min = [0.6 0.3]; cfg.spi_dur_max = 2.5; cfg.spi_thr(1, 1) = 2; cfg.spi_thr(2, 1) = 2.25;
Matlab
10
2024-07-14
数据挖掘测试数据集iris、libras、多特征数据集
数据挖掘是从海量数据中提取有价值知识的过程,结合统计学、计算机科学和人工智能等多个领域技术。测试数据集在验证和评估模型性能中起关键作用。以下是几个经典数据集的详细介绍:1. Iris数据集:由Ronald Fisher在1936年收集,包含150个样本,每个样本属于三种鸢尾花中的一种,有4个特征。2. Libras数据集:针对手语识别,包含39种动作,由34个人执行,记录了每个动作的39个关节位置信息。3. 多特征数据集:通常用于回归、分类等任务,具有多种属性和特征,来自不同领域如金融、医疗等。这些数据集广泛用于学术研究和教育,帮助理解和掌握数据挖掘的核心概念和技术。
数据挖掘
13
2024-07-16