这是一份包含南京机场过去四年天气详细数据的数据挖掘数据集,适用于微软商业解决方案。
南京机场天气数据挖掘资源集
相关推荐
Python天气数据爬虫
天气数据的爬虫代码,写得比较清爽,运行也比较稳当。用的是Python的爬虫库,逻辑不复杂,适合你快速上手搞点天气数据来练练手,或者做个数据可视化小项目也挺方便。
代码结构清晰,带注释,基本照着跑就能出结果。还用到了requests和BeautifulSoup来搞定网页求和数据解析,挺经典的组合,学起来也不难。你用requests.get()拉网页,用soup.select()挑元素,顺手。
如果你想采集个几年内的天气情况,还可以顺手看看这些:
爬虫获取近五年天气数据
2020 年 1-3 月全国天气数据集
南昌市 2017 至 2019 年天气数据
十年天气数据集 2009-2020
,这
统计分析
0
2025-06-17
2020年1-3月全国天气数据集下载
标题“全国天气信息.zip”指出这是一个压缩文件,内含2020年1-3月的中国各地气象数据。数据量超过20万条,涵盖风向、空气质量等多维天气信息,并计划后续更新。压缩包包含“城市天气信息.sql”和“全国城市天气信息.xlsx”两个文件,分别提供SQL数据库格式和Excel表格格式,方便数据分析与处理。
MySQL
7
2024-08-23
信息增益计算示例:以天气数据集为例
信息增益计算示例:以天气数据集为例
本示例使用天气数据集 weather,目标是计算使用属性“wind”(风力)划分数据集 S 所获得的信息增益。
数据集 S:
| outlook | temperature | humidity | wind | play ball ||---|---|---|---|---|| sunny | hot | high | weak | no || sunny | hot | high | strong | no || overcast | hot | high | weak | yes || rain | mild | high | weak | yes |
算法与数据结构
19
2024-05-23
生物数据挖掘技术资源集
生物数据挖掘的技术资源,推荐你一定得看《生物数据挖掘》这篇文章。讲得挺透的,从聚类、分类算法到深度学习,都结合了具体的生物学场景,像基因表达、蛋白质交互这些,真的贴地气。聚类部分比较实用,像用来基因表达数据,还能识别疾病相关的基因群,这类方法在项目里经常用到。顺带一提,这里有个时间序列的聚类算法源码实现,结合着用效果更好。支持向量机(SVM)也讲得不错,不只是讲理论,还贴了多实战链接,像SVM 应用详解、Matlab 实战,如果你搞预测建模的,可以顺便看下。还有一点值得说,文中对神经网络的应用也提到了,像CNN做 DNA 序列识别,RNN基因表达时间序列,还有GAN模拟实验数据,都是蛮有意思的
数据挖掘
0
2025-06-15
爬虫获取近五年天气数据
获取近五年天气数据
数据挖掘
19
2024-05-13
数据挖掘基础课件资源集
数据挖掘课件的资源还挺全的,适合刚入门或想打牢基础的同学。压缩包里不只是理论,还有 PPT、代码、算法啥的,结构也清晰,照着顺序学基本没啥障碍。你要是想快速上手,比如跑个 K-means 聚类、玩玩决策树,这里面就有现成的例子。
数据挖掘的核心算法讲得比较细,分类、聚类、关联规则都有涉及。像Apriori算法和DBSCAN这些,平时项目里也能用得上。不太懂算法原理也没关系,PPT 那部分讲得挺图文并茂的,蛮直观。
数据预部分讲的也比较实在,什么数据清洗、转换、规约都有提,还配了流程图,适合你做项目前理一理思路。顺手整理下数据,后面的建模才能顺。
要说亮点,就是那几个代码示例和数据集,基本能直接
数据挖掘
0
2025-06-16
十年天气数据集2009-2020可用于分析与预测
如果你需要一份全面的天气数据集来做,这个十年的数据集应该挺合适。涵盖了 2009 年到 2020 年 7 月的逐日天气数据,包括了像平均温度、湿度、风速、气压等信息,简直是各种天气的宝贵资源。适合做一些数据挖掘或者预测。你也可以用这些数据做天气趋势预测,甚至试试深度学习中的 LSTM 模型。数据集还包括了多辅助字段,比如最大风速、降水量等,的时候方便。嗯,如果你想做数据可视化展示,像 Seaborn 和 PCA 也都能容易上手。直接使用,或者当作其他工具的基础,都是蛮不错的选择。只要你熟悉天气数据,这个集子就可以让你事半功倍!
统计分析
0
2025-06-13
基于层次聚类的机场噪声数据挖掘
针对机场噪声数据的特征,提出了一种基于代表点的快速层次聚类算法。该算法在传统凝聚层次聚类算法的基础上,结合聚类代表点法和二分法策略进行改进,以提高效率。 为了评价聚类结果,提出了一种结合聚类代表点和聚类算法相似性定义的方法。实验结果表明,该算法不仅运行效率高,而且能够较准确地发现特定类型飞行事件的噪声分布模式。利用该分布模式,可以较准确地预测特定类型飞行事件的噪声分布状况。
数据挖掘
15
2024-05-19
数据挖掘数据集经典数据集资源
数据挖掘其实就是从海量数据中提取有用信息的过程,像是从一堆无序的数字中发现规律,挺神奇的。这里面,数据集就像是你的“试卷”,用来训练和测试各种算法。就拿 UCI Machine Learning Repository 来说,它是一个相当经典的数据集资源库,包含了多常用的经典数据集,比如鸢尾花分类、肿瘤诊断这些任务。数据挖掘中有个文件格式叫ARFF(Attribute-Relation File Format),它是 Weka 这个开源工具使用的标准格式,里面包含了数据属性的信息和实际的数据。比如,数据清洗、标准化、去噪这些预操作,Weka 就能帮你搞定。如果你做的是分类任务,可以用决策树、SV
数据挖掘
0
2025-06-11