浙大
当前话题为您枚举了最新的浙大。在这里,您可以轻松访问广泛的教程、示例代码和实用工具,帮助您有效地学习和应用这些核心编程技术。查看页面下方的资源列表,快速下载您需要的资料。我们的资源覆盖从基础到高级的各种主题,无论您是初学者还是有经验的开发者,都能找到有价值的信息。
MATLAB浙大课件合集
浙大的 MATLAB 课件内容挺扎实,适合你想从 0 开始啃透这个工具的时候用。资料系统、例子丰富,多操作像矩阵计算、数据可视化、函数写法都讲得比较细,尤其是对刚接触 MATLAB 的人来说,跟着一步步练,能少踩多坑。像plot怎么画图、inv怎么求逆,甚至后期怎么跑优化、做图像,课件都有提到,真的挺全的。控制语句、循环、函数封装这些基础也没落下,脚本和函数怎么分工用也说得明白。再深入点的线性代数、数值内容也覆盖到了,讲得还不错。如果你打算用 MATLAB 做课题、写算法、实验数据,这套课件可以先收着慢慢看,值得翻。
Matlab
0
2025-06-24
[浙大-数据挖掘].1-106.csf [浙大-数据挖掘].1-106.csf
[浙大-数据挖掘].1-106.csf [浙大-数据挖掘].1-106.csf
数据挖掘
10
2024-07-23
浙大数据集成讲解
数据集成与模式集成
数据集成是指将来自多个数据源的数据整合到一个统一的存储中,而模式集成则是整合不同数据源的元数据,为数据集成提供基础。
实体识别与数据冲突
实体识别是指匹配来自不同数据源的现实世界实体,例如将数据源A中的“cust-id”与数据源B中的“customer_no”匹配。
在数据集成过程中,需要检测并解决数据值的冲突。同一实体在不同数据源中的属性值可能存在差异,其原因可能是不同的数据表示方式或度量标准等。
Memcached
23
2024-05-12
浙大数据挖掘教程
浙大数据挖掘课件助您掌握数据挖掘技能。
数据挖掘
14
2024-05-13
浙大大数据分类系统详解
数据挖掘系统的分类涵盖了一般功能、描述性数据挖掘和预测性数据挖掘等不同视角。根据挖掘的数据库类型、知识类型、技术使用和应用等多个维度进行分类。
Memcached
10
2024-07-20
数据挖掘教程浙大课程精选
浙江大学的《数据挖掘教程》讲得还挺扎实的,适合想系统入门数据挖掘的朋友。从数据仓库、OLAP 讲到聚类和电商实战,内容跨度大,概念解释也比较通俗,PPT 也做得还行,适合一边啃一边查资料消化。尤其是像关联规则挖掘和分类预测这类知识点,用到了不少经典算法,像Apriori和K-means,有些地方还能直接迁移到工作中用。
数据仓库的架构和OLAP 的多维部分我觉得讲得蛮清楚的,适合搞 BI 系统或者报表的同学,概念和用法都覆盖到了,切片/切块/钻取那些操作如果你平时做数据会经常碰到。
数据预那块也别跳过,像数据清洗、归一化这种操作,前期不做,后面挖掘效果也不会好,别问我怎么知道的(心酸史)。聚类
数据挖掘
0
2025-07-01
大数据体系结构-浙大解析
联机分析挖掘的体系结构包括数据仓库、元数据、多维数据库、OLAM引擎、OLAP引擎和用户图形界面。API用于数据方体、数据库和数据清理、集成。Layer3为OLAP/OLAM,Layer2为多维数据库,Layer1为数据存储,Layer4为用户界面。数据过滤与集成、约束数据挖掘以及挖掘结果均包含在内。
Memcached
18
2024-07-12
事实星座模式示例:解读浙大大数据
事实星座模式示例:以销售数据为例
销售事实表(Sales Fact Table)
| 字段名 | 描述 ||---|---|| time_key | 时间维度键 || item_key | 商品维度键 || branch_key | 分支机构维度键 || location_key | 地理位置维度键 || units_sold | 销售数量 || dollars_sold | 销售额 || avg_sales | 平均销售额 |
运输事实表(Shipping Fact Table)
| 字段名 | 描述 ||---|---|| time_key | 时间维度键 || item_key
Memcached
17
2024-05-12
浙大探讨大数据的数据压缩策略
数据仓库中存储了大量数据,进行复杂的数据分析与挖掘通常耗时较长。数据压缩策略可以有效减少数据集大小,同时保持几乎相同的分析结果,例如数据立方体聚集和维归约。在数据压缩后,节省的挖掘时间可以超过归约过程中的消耗。
Memcached
9
2024-10-09
浙大关于大数据的解析和下载
数值区域的自然划分可以使数据更加直观和易于理解。按照3-4-5规则,根据数据集的极值分布,我们将数值区域划分为不同的等宽子区间,以便更好地呈现数据分布情况。例如,对于年薪的划分,我们采用了【10,000~20,000】,【20,000~30,000】,【30,000~40,000】等区间,这种自然划分方法能够有效避免数据分析结果的扭曲。
Memcached
7
2024-10-12