这个数据集适用于Python数据挖掘入门实践,特别是运用决策树预测NBA比赛获胜球队的章节。由于书籍中提供的原始下载链接已失效,这份资源提供最新版本的数据,方便学习者使用。
2019-19 NBA Season.csv 数据集
相关推荐
kddcup2005.csv 数据集
这是 kddcup2005 数据集,可用于机器学习研究。
数据挖掘
11
2024-05-20
orange-juice-withmissing.csv数据集
orange_juice_withmissing.csv 是 ISLR 包中橙汁数据的修改版本,用于预测顾客购买的橙汁品牌(柑橘山或美汁源)。
该数据集包含 1070 行和 18 列,涵盖客户和产品特征等预测变量。响应变量 'purche' 的值为 'ch'(柑橘山)或 'mm'(美汁源)。
该数据集常用于博客文章和 Caret 包的练习中。Caret(Classification And REgression Training)包集成了模型开发的所有相关步骤。
数据挖掘
13
2024-05-15
2019年9月IP地址归属地数据集
文件"IP_201909.rar"暗示了这是一个包含2019年9月关于IP地址归属地信息的压缩文件。描述提到数据以CSV(Comma Separated Values)格式存储,这是一种常见的表格数据存储格式,易于读取和处理。这种文件可以用文本编辑器打开,同时也能直接导入数据库管理系统,比如MySQL,这是标签中提到的一个关键词。 CSV文件是一种轻量级的数据交换格式,广泛用于数据导入和导出。每个记录由一系列字段组成,字段之间用逗号分隔。在"IP_201909.csv"这个例子中,我们可以预期数据包含多个IP地址及其对应的归属地信息,可能包括国家、地区、城市、运营商等详细信息。这样的数据对于网
MySQL
13
2024-08-27
2014-2018年全国空气质量CSV数据集下载
这份数据集包含从2014年到2018年期间收集的全国空气质量数据,记录了时间、城市、AQI、PM2.5、PM10、SO2、NO2、CO、O3以及主要污染物等信息,总计55万条记录。数据集适用于研究空气质量变化趋势及相关环境研究。
spark
7
2024-08-12
PCA 数据集
该数据集包含 PCA 分析的数据。
数据挖掘
18
2024-05-15
MovieLens数据集
包含推荐系统算法开发和评估所需的用户评分、电影元数据和标签。
算法与数据结构
18
2024-05-01
Lastfm数据集
标签推荐算法中常用的数据集,源自Lastfm。
spark
16
2024-05-15
Seaborn 数据集
包含 Seaborn 可视化库所需的所有基础数据集。
算法与数据结构
16
2024-05-28
MNIST 数据集
MNIST 数据集已打包,内含训练和测试数据。
算法与数据结构
25
2024-05-26