基于非线性相关的数据挖掘新算法* (2007年)
现有的关联规则挖掘算法专注于频繁集搜索,在设定支持度和置信度时存在较大偶然性,不利于精确控制;同时未能全面反映数据整体的相关性。为了克服这些问题,引入了非线性相关的概念,用于各种类型规则的挖掘,无需人工设定参数,显著提升了规则发现的效果。
数据挖掘
8
2024-07-15
数据挖掘算法研究基于非线性相关的创新方法
现有的关联规则挖掘算法专注于频繁集搜索,并依赖于预设的支持度和置信度,存在较大的随机性和控制困难。此外,这些规则未能全面反映数据整体的相关性。为了克服这些问题,引入了非线性相关的概念,用于各种相关类型规则的挖掘,无需人为设定参数,显著提高了规则发现的效率。
数据挖掘
16
2024-07-17
n维线性空间中的斜对称双线性函数
本节讨论数域 F 上的 n 维线性空间 V 的斜对称双线性函数。斜对称双线性函数满足以下性质:
对于任意向量 α ∈ V,f(α, α) = 0。
f(α, β) 在 V 的基下的方阵是斜对称的。
V 中向量关于 f(α, β) 的正交性是对称的。
斜对称双线性函数与斜对称方阵之间存在双射。
进一步,我们给出了斜对称双线性函数的准对角形形式,并证明了其秩与准对角形中非零块的数量之间的关系。
算法与数据结构
15
2024-06-11
规范变换与Euclid空间中的线性方阵分析
§7.4 规范变换
本节讨论n维Euclid空间V的一类重要的线性变换。
定义 7.4.1
如果n维Euclid空间V的线性变换A与它的伴随变换A∗可交换,即 A A∗ = A∗ A,则A称为规范变换。根据定理7.3.6,如果n维Euclid空间V的线性变换A在V的一组基下的方阵为A,则它的伴随变换A∗在同一组基下的方阵为AT,因此可以引进规范方阵的概念如下。
定义 7.4.2
如果n阶实方阵A与它的转置AT可交换,即 A AT = AT A,则方阵A称为规范方阵。
定理 7.4.1
设A是n维Euclid空间V的线性变换,则下述命题等价:1. A是规范变换。2. 对任意α ∈ V,满足 ∥A
算法与数据结构
30
2024-11-07
快速计算向量相关性
快速相关算法在C语言中高效、稳定地计算两个向量之间的相关性。将其编译为fastcorr.dll后可供Matlab调用。另提供备用函数SLOWCORRELATION,仅供参考,实际计算中效率较低。
Matlab
12
2024-05-12
变量相关性的计算参数比较
综合多篇文章,总结了计算变量相关性的三个主要参数:皮尔逊相关系数、距离相关和最大信息系数。文章详细介绍了它们各自的计算方法和应用场景。
算法与数据结构
16
2024-07-15
线性空间:概念与定义
线性空间:概念与定义
集合与运算的结合构成了数学的基石,而线性空间则是这种结合的典范体现。线性空间的概念将向量加法和标量乘法抽象出来,为我们提供了一个研究向量和其性质的通用框架。
定义
一个线性空间 V 是一个非空集合,其元素被称为向量,并定义了两种运算:
向量加法: 对于任意 α,β ∈ V,存在唯一的向量 α + β ∈ V,称为 α 和 β 的和。
标量乘法: 对于任意标量 λ ∈ F (F 是一个数域) 和向量 α ∈ V,存在唯一的向量 λα ∈ V。
这些运算满足以下公理:
向量加法:
结合律: (α + β) + γ = α + (β + γ)
交换律: α + β = β
算法与数据结构
20
2024-05-19
解读相关性分析与相关系数
相关性分析与相关系数
相关性分析用于探索两组数据集中数据之间的关系,即使它们采用不同的度量单位。而相关系数 (R) 则量化了这种关系的强度和方向。
计算方法: 相关系数是两组数据集的协方差与其标准偏差乘积的商。
结果解读:
R > 0: 表示正相关,即一组数据中的较大值对应于另一组数据中的较大值。
R < 0> 表示负相关,即一组数据中的较大值对应于另一组数据中的较小值。
R = 0: 表示不存在线性相关关系,但并不排除其他类型的关系。
R 的绝对值越接近 1,相关性越强;越接近 0,相关性越弱。
统计分析
10
2024-05-29
杂草性状与分布危害的相关性研究
为探究影响我国杂草分布和危害程度的生物学因素, 研究人员以 1387 种中国境内杂草为研究对象, 分析了其分布危害等级与 28 个生态适应性状之间的关系。这些性状涵盖种子(果实)产量、传播方式、营养繁殖能力、生活史长短、繁育系统、生活型、花部特征、传粉方式、毒性、刺以及适应的生境类型等。研究结果显示, 对于 1387 种杂草整体而言, 生活史短、花两性、种子产量高、种子(果实)具备特殊传播方式、阳生、有毒以及直立、挺水、莲座状生活型的植物, 其分布危害等级较高。
统计分析
14
2024-05-19