首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
文章基于高斯回归模型,利用坐标算法并结合KKT条件对已存在的正则估计方法进行了改进,提出了一种对高维数据更加有效的变量选择(或称特征提取)的正则化估计方法.该方法考虑了实际数据中存在的噪声对正则化估计的影响,并能对噪声进行有效估计,文中给出了改进算法的实施细节,并通过实验结果验证了该方法在一定数据范围内具有估计的有效性和提高变量选择(特征提取)的准确性.  相似文献   

2.
大数据背景下,基于罚函数的正则化方法是高维数据变量选择的重要方法.Lasso估计是常用的变量选择方法,而Lasso正则化参数的取值直接影响选择模型的性能,是正则化方法成败的关键.针对Lasso估计,提出一种新的L曲线(LC)准则选择正则化参数.数值模拟和实际应用表明:相比CV,GCV,BIC等准则,LC准则能够以较高的...  相似文献   

3.
针对生存分析中建立生存模型时,如何处理生存数据中特有的数据类型——删失数据,降低高维协变量的维数,更好地识别出真正具有预测性的因子,建立准确的生存模型的问题,提出用STUTE’s加权最小二乘法和删失限制以及LASSO正则化相结合的方法来对AFT模型进行估计。首先,提出STUTE’s加权最小二乘法和删失限制相结合的方法对生存数据中的删失数据进行处理;其次,提出了LASSO的一个新的实现算法进行模型的变量选择,降低模型中协变量的维数,精简模型;最后,通过仿真分析得到提出的新估计方法较已有的LASSO旧算法以及其他的变量选择方法,VSURF算法更能找出"真"因子,建立准确的生存模型。  相似文献   

4.
针对具有异常值或离群点的高维数据线性回归模型,提出了一种基于误差函数正则化的惩罚分位数回归的新方法,与经典的L1惩罚方法相比,新方法具有更好的稳健性以及更小的估计偏差和预测误差;为解决分位数损失函数非光滑性与误差函数非凸性所带来的计算挑战,结合迭代再加权L1算法以及ADMM算法,提出了一种有效的IRWADMM算法,并对回归系数进行了求解.模拟结果表明,与已有的惩罚分位数回归方法相比,新方法在参数估计和变量选择等方面均具有更好的表现.将新方法应用于核黄素基因数据分析,以证实其有效性和可行性.  相似文献   

5.
一个不适定问题的正则化及误差估计   总被引:4,自引:2,他引:2  
讨论了一个一维逆热传导问题,利用正则化方法得到了表面热流的近似解,在假定(未知)精确解属于H^α(R),α≥1/2条件下,给出了阶为1/(1n1/ε)^2α的误差估计,其中ε为测量误差的L^2界,解决了同类研究中的一个遗留问题。  相似文献   

6.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

7.
精度矩阵在高斯图模型中具有广泛的应用,许多正则化方法用于精度矩阵的估计问题,然而却很少有对其解轨迹的关注。本文主要利用条件数正则化协方差矩阵估计的方法来探索精度矩阵估计的解轨迹,数值模拟结果表明该轨迹算法可以便捷地描绘出精度矩阵估计的解轨迹。  相似文献   

8.
讨论了一类一维反向热传导问题,利用Fourier正则化方法给出了正则近似解,得到了H(o)lder型误差估计.同时通过提高先验光滑性假设,并利用Tikhonov正则化方法得到了对数型稳定性估计,解决了零点的收敛性问题.  相似文献   

9.
将LASSO方法应用于财务危机预警的关键指标选择,并借助90家制造业上市公司的财务数据建立了基于LASSO方法的财务预警模型.提出的模型不仅实现了两个关键财务指标的自动选择,而且获得了较高的预测精度,这为企业纠正经营方向、改进经营决策和有效配置资源提供了可靠的依据.  相似文献   

10.
考虑了多元数据拟合过程中的不适定问题,采用Tikhonov正则化方法,在最小化泛函中引入正则化泛函解决整个辨识过程中的不适定问题,并且利用贝叶斯正则化方法迭代计算正则化参数及方程解。最后,通过数值模拟验证方法的有效性。  相似文献   

11.
信息时代的快速发展带来的是信息总量呈现几何级数的增加,而海量数据的存储和分析处理对计算机硬件能力和数据分析能力都是一个极大的挑战.数据挖掘算法是针对于大批量数据处理而提出并逐步发展起来的,基于完备的数据库技术,可以在云计算算法、矩阵压缩算法和并行关联算法的基础上,进行算法集成,能进一步提高数据挖掘的速度、精度和时效性,在实际海量数据的处理过程中有较好的适应性,为海量数据处理提供了新的技术分析方法.  相似文献   

12.
论述了数据挖掘在免疫IDS系统中的应用,详细描述了关联规则和序列模式挖掘算法,在一定程度上弥补了阴性选择算法的不足。并提出了一个新的基于数据挖掘和人工免疫的入侵检测模型,克服了现有入侵检测模型的缺点。  相似文献   

13.
数据挖掘领域中的聚类方法   总被引:4,自引:0,他引:4  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

14.
由于小波理论具有良好的构造性和实际应用性,近年来被广泛地应用于诸如图像处理、计算机可视化、网络管理和数据挖掘等计算机科学研究领域.小波有很多良好的性质,如多分辨的分解结构、变换的时空线性复杂性等特性,从而可以为数据挖掘提供更加有效的算法.给出了小波在聚类、分类、分布式数据挖掘、相似性搜索、近似查询处理、可视化等算法中的运用,讨论了小波在数据挖掘研究中的影响,并简述了有潜力的未来研究方向.  相似文献   

15.
一种网络日志挖掘的高效算法   总被引:1,自引:1,他引:0  
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。  相似文献   

16.
数据挖掘分类算法研究综述   总被引:1,自引:0,他引:1  
随着数据库应用的不断深化,数据库的规模急剧膨胀,数据挖掘已成为当今研究的热点;特别是其中的分类问题,由于其使用的广泛性,现已引起了越来越多的关注。对数据挖掘分类问题的研究现状进行了综述:首先对研究比较多的基于判定树的归纳分类、基于人工神经网络的分类和基于统计的贝叶斯分类作了详细的讨论;然后对目前新提出的几种算法作了简要分析;最后根据数据挖掘的发展现状和研究重点对数据挖掘分类算法的发展趋势作了展望。  相似文献   

17.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

18.
多策略数据挖掘系统的分析与设计   总被引:1,自引:1,他引:0  
为了满足数据规模的膨胀和分析需求的增长,在对数据挖掘系统的发展史进行回顾的基础上,分析了国内外典型数据挖掘系统的特点,设计了一个多策略的数据挖掘系统。并针对数据挖掘面临的大规模海量数据的处理问题,为系统引入和设计了算法插件思想、缓冲区处理技术、基于XML(Extensib le M arkup Lan-guage)语言的配置文件和相应的并行处理技术。最后讨论了系统今后开发过程中需要注意算法更新及评估的问题。  相似文献   

19.
企业家在进行投资前考虑的一个重要方面是企业未来的盈利能力,而最终是否盈利则取决于收入和支出。员工的工资总额(劳动力成本的主要部分)作为企业的一项重要支出自然纳入企业家投资决策的考虑范围,对我国不同地区不同行业劳动力成本的合理估计对决策的制定有着重要意义。通过基于聚类分析的数据挖掘技术,结合实证分析对19个主要行业和31个省市自治区(中国大陆)的薪资水平进行了分析和对比,以更直观的方式揭示内在含义,为企业投资决策提供支撑。  相似文献   

20.
数据挖掘的探讨   总被引:1,自引:0,他引:1  
从数据挖掘的定义出发,探讨了数据挖掘的流程、数据挖掘中出现的问题以及数据挖掘的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号