针对高维数据的特性,即变量数远多于样本数,并且数据呈现异质性,基于众数回归分析和变量选择降维技术,提出了一种创新的特征选择方法。该方法利用局部二次逼近算法(LQA)和最大期望(EM)算法,提供了估计算法和最优调节参数的选取策略。通过模拟数据实验分析显示,该方法在非正态误差分布情况下,比传统的基于最小二乘和中位数的正则化估计方法具有更高的预测能力和稳健性。
高维数据挖掘中特征选择的创新方法
相关推荐
高维数据挖掘中特征选择的稳健方法
针对112Gb/s PM-(D)QPSK系统,特别是具有2.5GHz最大频偏的典型激光器,存在 |△f-f_e|=π/2 或 |f-f_e|=Rs/4 的情况。此时,若能判断频偏估值是否错误,则可利用此规律直接获得正确频偏估值,并将其作为G-PADE的初始设置值。
判断频偏估值正确与否可通过BER轻松实现,因为正确和错误的估值对应着截然不同的BER:一个接近0.5,另一个略大于0。因此,无论初始真实频偏为何值,G-PADE的初始化问题都能得到解决。方法如下:
G-PADE开始工作前,利用四次方法对一段符号进行频偏估计,同时监测该段符号的BER。
通过BER判断估值是否收敛正确。
若正确,则
数据挖掘
22
2024-05-19
高维数据挖掘中特征选择的稳健方法总结
表4.7 总结了在高维数据挖掘中特征选择方法vV算法中问变量的取值范围。这些变量的理论和实测范围包括定点设计属性输入符号的实部和虚部,以及幅度。具体包括(-2, +2)和(-16, +16)的幅度。此外,还涵盖了一组符号四次方后的求和结果,以及该结果的幅度(-128, +128)。各组符号的相位调整在(+1, +4)之间,确保输出符号的相位偏估计结果精确有效。
数据挖掘
9
2024-09-14
频偏仿真-高维数据挖掘中特征选择的稳健方法
频偏变化多的场景下,用传统方法总感觉差点意思,尤其是在高维数据挖掘里做特征选择,容易被噪声干扰。这篇讲频偏仿真的文章就挺有意思,结合了稳健方法,思路清晰,例子也贴地气。你做信号相关的,不妨看看。
高维特征选择的稳健性一直是难点,尤其在数据噪声或频率漂移比较严重时,模型容易被带偏。这篇文章就挺细,做了多组对比仿真,能看出不同频偏情况下方法的稳定性。
里面提到的仿真设置也比较实用,比如输入频率的偏移范围设定,还有如何控制信噪比变量,这些在实际工程里都用得上。写法不花哨,看得懂,用得上。
如果你想深入研究特征选择策略,可以顺手看看高维数据挖掘中特征选择的稳健方法那篇,思路比较系统;另外频偏估计那篇也
数据挖掘
0
2025-06-17
数据挖掘中的创新方法支持向量机探索
国内一位教师撰写的数据挖掘教材,着眼于优化方法,深入探讨了支持向量机的应用。
数据挖掘
11
2024-07-13
数据挖掘中的创新方法支持向量机探索
支持向量机作为数据挖掘领域中的新兴方法,正逐步成为研究重点。它以其在处理复杂数据集方面的卓越表现,吸引了广泛的关注和应用。
数据挖掘
12
2024-07-17
基于预判决的频偏估计算法原理-高维数据挖掘中特征选择的稳健方法
基于预判决的频偏估计算法(PADE算法)是一种应用于相干接收机中的前馈式全数字频偏估计方法,主要通过模拟预判决来估计当前符号的频偏,结合环路滤波器抑制噪声影响,有效消除载波频偏对相位调制信号的影响。与传统四次方频偏估计算法不同,PADE算法依赖于前一个输入符号的频偏估计结果,以优化当前符号的频偏估计,最终通过减去估计值来修正频偏引起的相位分量。
数据挖掘
14
2024-08-08
创新方法上海证交所数据挖掘培训
利用神经网络、逻辑回归和决策图表结合的新方法,开发了一种创新的破产/风险模型。新的变量选择过程使得该模型显著超越了传统商业模型。
数据挖掘
14
2024-07-14
数据挖掘中的新方法-支持向量机
中国农业大学邓乃扬教授编著的专著,全面讲解支持向量机的原理、方法和应用。
数据挖掘
10
2024-05-01
数据挖掘的新方法:支持向量机
以支持向量机(SVM)为代表的机器学习算法在数据挖掘中发挥着重要作用。SVM是一种监督学习算法,用于分类和回归任务。在数据挖掘中,SVM因其处理高维数据和非线性数据的能力而受到青睐。
在支持向量机中,将数据点映射到更高维的特征空间,并使用超平面将数据点分隔开来。超平面是特征空间中将不同类别的点分开的决策边界。SVM的目标是找到最佳超平面,使超平面与支持向量(距离超平面最近的数据点)之间的间隔最大化。
SVM在数据挖掘中广泛应用于图像分类、文本分类、自然语言处理、生物信息学等领域。通过优化超平面和支持向量,SVM能够有效解决复杂的数据挖掘问题。
数据挖掘
15
2024-04-30