这是 kddcup2005 数据集,可用于机器学习研究。
kddcup2005.csv 数据集
相关推荐
orange-juice-withmissing.csv数据集
orange_juice_withmissing.csv 是 ISLR 包中橙汁数据的修改版本,用于预测顾客购买的橙汁品牌(柑橘山或美汁源)。
该数据集包含 1070 行和 18 列,涵盖客户和产品特征等预测变量。响应变量 'purche' 的值为 'ch'(柑橘山)或 'mm'(美汁源)。
该数据集常用于博客文章和 Caret 包的练习中。Caret(Classification And REgression Training)包集成了模型开发的所有相关步骤。
数据挖掘
13
2024-05-15
2019-19 NBA Season.csv 数据集
这个数据集适用于Python数据挖掘入门实践,特别是运用决策树预测NBA比赛获胜球队的章节。由于书籍中提供的原始下载链接已失效,这份资源提供最新版本的数据,方便学习者使用。
数据挖掘
17
2024-05-21
2014-2018年全国空气质量CSV数据集下载
这份数据集包含从2014年到2018年期间收集的全国空气质量数据,记录了时间、城市、AQI、PM2.5、PM10、SO2、NO2、CO、O3以及主要污染物等信息,总计55万条记录。数据集适用于研究空气质量变化趋势及相关环境研究。
spark
7
2024-08-12
百度地图纠偏数据集(SQL SERVER 2005)
提供 SQL SERVER 2005 备份格式的百度地图纠偏数据集,用于校正地图坐标的精度。
SQLServer
12
2024-06-01
PCA 数据集
该数据集包含 PCA 分析的数据。
数据挖掘
18
2024-05-15
MovieLens数据集
包含推荐系统算法开发和评估所需的用户评分、电影元数据和标签。
算法与数据结构
18
2024-05-01
Lastfm数据集
标签推荐算法中常用的数据集,源自Lastfm。
spark
16
2024-05-15
Seaborn 数据集
包含 Seaborn 可视化库所需的所有基础数据集。
算法与数据结构
16
2024-05-28
MNIST 数据集
MNIST 数据集已打包,内含训练和测试数据。
算法与数据结构
25
2024-05-26