这是 kddcup2005 数据集,可用于机器学习研究。
kddcup2005.csv 数据集
相关推荐
orange-juice-withmissing.csv数据集
orange_juice_withmissing.csv 是 ISLR 包中橙汁数据的修改版本,用于预测顾客购买的橙汁品牌(柑橘山或美汁源)。
该数据集包含 1070 行和 18 列,涵盖客户和产品特征等预测变量。响应变量 'purche' 的值为 'ch'(柑橘山)或 'mm'(美汁源)。
该数据集常用于博客文章和 Caret 包的练习中。Caret(Classification And REgression Training)包集成了模型开发的所有相关步骤。
数据挖掘
13
2024-05-15
2019-19 NBA Season.csv 数据集
这个数据集适用于Python数据挖掘入门实践,特别是运用决策树预测NBA比赛获胜球队的章节。由于书籍中提供的原始下载链接已失效,这份资源提供最新版本的数据,方便学习者使用。
数据挖掘
17
2024-05-21
IP地址所属地数据集2016.07CSV版本
IP 地址的地理位置数据集,对数据或者网络安全这块感兴趣的你,会挺喜欢的。2016 年 7 月的版本,虽然有点旧,但当做历史对比、趋势研究,还是蛮有价值的。格式是CSV,用起来比较方便,用pandas一加载就能。
里面的IPmark.csv文件,估计是核心内容。每行应该都有 IP、国家、城市这些字段,结构清晰,起来也不麻烦。如果你用 Python,直接read_csv()拉进来,再做些清洗,基本就能跑起来。
用这个数据干嘛?比如统计不同国家 IP 分布,做广告定向,用户访问地,甚至安全审计都可以。有需求的,你也可以结合folium或matplotlib来做地理分布可视化,直观又炫。
不过注意哈
Oracle
0
2025-06-15
2014-2018年全国空气质量CSV数据集下载
这份数据集包含从2014年到2018年期间收集的全国空气质量数据,记录了时间、城市、AQI、PM2.5、PM10、SO2、NO2、CO、O3以及主要污染物等信息,总计55万条记录。数据集适用于研究空气质量变化趋势及相关环境研究。
spark
7
2024-08-12
百度地图纠偏数据集(SQL SERVER 2005)
提供 SQL SERVER 2005 备份格式的百度地图纠偏数据集,用于校正地图坐标的精度。
SQLServer
12
2024-06-01
北京-郑州运输通道旅客出行特征数据集2005
旅客出行特征的统计资源挺适合做数据可视化或调研类项目的参考素材。里面的调查内容够细,像月收入、出行目的、交通工具选择都有涉及,而且区分了不同里程段的出行偏好。你要是做ECharts或D3.js相关的可视化,拿它做练习合适。数据来自铁路专线背景,年代是 2005 年,不过一些出行规律到现在都还蛮有参考价值的。
统计分析
0
2025-06-14
2017年中国综合社会调查(CGSS)CSV数据集
这份 2017 年中国综合社会调查(CGSS)的数据资源,适合用作数据或编程练习。数据格式是csv,简单易用,适合各种数据和任务。你可以直接从官网(官网)下载,数据不仅包含社会调查的各类信息,还可以轻松导入到Python或R进行。需要注意的是,这份数据只供学习与研究使用,严禁商用哦。对于数据新人来说,真的是一个挺好的练习资源,拿来做数据清洗、可视化等都挺合适。如果你想要用这份数据做一些更深的,可以参考一些工具,比如MySQL、PLSQL等,它们和这份数据也挺配的。别忘了,数据集本身包含了多社会指标,能为你丰富的维度,挺不错的。
算法与数据结构
0
2025-06-16
MovieLens数据集
包含推荐系统算法开发和评估所需的用户评分、电影元数据和标签。
算法与数据结构
18
2024-05-01
PCA 数据集
该数据集包含 PCA 分析的数据。
数据挖掘
18
2024-05-15