首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
综合最小二乘回归估计和支持向量机回归估计算法的各自在回归理论上的优势,通过理论推导,提出一种改进的支持向量机回归估计算法--SVR-LS方法.然后通过实验对比验证,发现新方法不但在拟合逼近方面有不错的效果,而且在回归估计方面,其学习速度和精度都要优于标准的支持向量机回归估计算法.  相似文献   

2.
一种多率采样的在线支持向量回归及应用   总被引:1,自引:1,他引:0  
针对应用支持向量回归对不确定控制系统在线建模时精度受异常数据影响的问题,通过分析不同样本分布情况下异常数据的影响,指出增加异常数据邻域的样本密度可以有效地提高建模精度.提出了多率采样的支持向量回归在线建模方法,通过多率采样增加局部样本密度,并利用支持向量回归在小样本学习时的良好性能,构建一种局部样本密集的滚动时间窗,用以减少训练样本数和在线剔除异常数据.将该方法应用于多通道电液力伺服同步加载系统的负荷输出预测,结果表明,与传统单率采样的方法相比,在训练样本只增加2个的情况下,该方法具有更好的鲁棒性和预测精度,预测平均绝对误差达到了0.66%.  相似文献   

3.
通过对统计学习理论中的支持向量回归问题,特别是结构风险问题和ε-不敏感函数的分析,得到了一种新的支持向量回归算法.新算法将传统的支持向量回归问题中的二次优化问题改进为线性规划问题,这一改进大大降低了求解的复杂度,其训练时间快了至少一个数量级以上.最后对人工和实际的样本进行了试验,结果说明了线性规划支持向量回归能较好地逼近被估计函数,且计算复杂度明显降低.  相似文献   

4.
与统计学习理论结合,并把数据样本映射到高维空间,有时标准支持向量回归机运算速度和精度不理想.针对线性不可分的情况,在支持向量回归机目标函数中增加两个平方松弛项,这样可以减少两个约束条件.每个松弛项赋予不同的加权系数,可根据实际需要调节它们的权重.这种新算法称为新型加权支持向量回归机(weighted support vector regression machine,WSVRM),并把它用于函数逼近.实验结果表明,所提出的新型加权支持向量回归机具有良好的函数估计能力和数据预测能力.  相似文献   

5.
针对传统异常检测模型在数据不平衡情况下对少数异常类样本识别效果较差的问题,提出了一种基于改进扩散映射的支持向量数据描述算法(DM-SVDD),构建新的模型并将其应用于工业异常检测。通过引入欧氏距离和马氏距离两种距离度量公式,构造新的近邻图改进扩散映射算法,结合支持向量数据描述算法进行建模,新模型不仅提高了对多数正常类样本的识别性能,且对少数异常类样本的检测性能也优于传统模型。实验数据选取多晶硅铸锭生产过程中的配料数据,研究结果表明:对于异常类样本较少所形成的不平衡数据,与传统的异常检测模型相比,所提出的改进模型可使G-Mean最优提升15.73%,F-Score最优提升19.37%,满足工业异常检测的需求,可用于指导实际生产过程,降低生产成本。  相似文献   

6.
针对入侵检测中少数类异常数据的检测精度较低的问题,提出基于支持向量聚类的不平衡数据无监督检测算法.方法采用支持向量聚类对所有未知样本进行聚类,根据不同类别样本内在属性的差异,用改进的重抽样方法选择样本,平衡数据集的分布,对新的数据集进行学习.经过KDD99的测试表明,该方法能有效检测出少数类样本.  相似文献   

7.
针对区间回归中上、下2个端点的误差范围不相同的非对称问题,建立了Fitness、Possibility 和Necessity 3个回归模型,对区间样本的中心趋势和最大、最小可能边界进行综合分析,并引入支持向量机,区分线性和非线性两种情况,提出了非对称区间回归支持向量机AIR-SVM(asymmetrical interval regression SVM)算法,对非对称区间数据集回归估计进行了分析.通过3个数据仿真实验,检验了提出算法的良好性能,有效地解决了非对称情况下精确数输入-区间数输出的区间数据回归问题.  相似文献   

8.
通过对标准的回归型支持向量机进行改进,得到一种新的学习算法。这种新的学习算法不仅能减少计算的复杂性,提高学习速度;而且能够自动确定ε参数,从而控制支持向量数;同时在一定程度上能提高回归估计的精度性,特别是用于解决大规模样本问题。  相似文献   

9.
通过对标准的回归型支持向量机进行改进,得到一种新的学习算法.这种新的学习算法不仅能减少计算的复杂性,提高学习速度;同时在一定程度上能提高回归估计的精确性,特别是用于解决大规模样本问题.  相似文献   

10.
针对风电场采集到的历史风速数据中存在异常值的问题,为保证风速数据的准确性和有效性,提出了一种运用差分自回归滑动平均(auto regressive integrated moving average,ARIMA)、小波分解(wavelet decomposition,WD)和隐马尔科夫(hidden Markov model,HMM)组合算法对异常风速数据进行挖掘的方法.采用ARIMA模型挖掘异常风速数据的潜在特征,得到反映风速值异常情况的残差序列;为进一步提高检测精度和降低系统误差的干扰,采用小波分解方法捕获残差序列中的粗大误差特征;借助HMM算法的双重随机过程检测异常风速值并剔除,将剔除异常值后的数据运用粒子群优化最小二乘支持向量机方法进行重构,保证风速序列的完整性.实际算例结果表明了所提方法的有效性和可行性.  相似文献   

11.
K-means算法以其简单、快速的特点在现实生活中得到广泛应用。然而传统K-means算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高。针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子。然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中。算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率。实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性。  相似文献   

12.
以多元统计分析技术为核心的间歇过程建模、在线监测逐渐成为过程工业的关注焦点,然而过程数据中存在的大量离群点将直接影响上述方法的可靠性,为此提出了一种基于偏鲁棒M-回归的间歇过程离群点检测方法.首先基于极大相关熵估计建立鲁棒预测模型;然后利用偏鲁棒M-回归算法计算模型的回归系数;最后采用Hampel识别器分析最终的权值,从而实现离群点的检测.将所提方法应用于某间歇反应过程,实验结果验证了方法的有效性.  相似文献   

13.
在冶金、化工等流程型工业领域,生产中的过程控制参数往往具有高维非线性结构特征.为了解决这类高维复杂数据的异常点检测问题,本文引入了软超球体的概念,采用非线性核函数将原始数据映射到高维的特征空间,并在特征空间中确定软超球体的边界.通过检测待识别样本映射到特征空间的位置信息来判定过程参数的设定值是否为异常点,从而避免出现批量的产品质量问题.以某类汽车用钢为应用实例,对实际生产数据进行检测,证明了所提出的基于软超球体的异常点识别算法对于高维的非线性数据具有良好的检测能力.  相似文献   

14.
支持向量回归机训练集的并行预处理方法   总被引:1,自引:1,他引:0  
为加快支持向量回归机在求解大样本集问题时的训练速度,提出了并行支持向量回归机。该方法根据核矩阵把数据集分成k个子集,通过并行预处理过滤掉非支持向量,再对剩余的支持向量进行训练得到决策函数。实验表明,本算法不仅预测准确度跟标准的分解算法基本一致,而且大大缩减训练时间,具有很高的加速比,同时需要的训练时间大大少于Graf等人提出的级联结构的算法,另外,算法还可有效地缩减支持向量的数目。  相似文献   

15.
针对数据集的聚类过程容易受到离群值的影响这一问题,提出了局部密度离群值检测k-means算法,即先对数据集使用局部密度离群值检测方法检测离群值,先把离群值去除,再进行k-means聚类,算法的有效性通过Davies-Bouldin指标(DB)、Dunn指标和Silhouette指标进行评价,在人工生成的数据集与UCI数据集上验证,去除离群值,再使用k-means算法得到的聚类结果相比原始数据集进行k-means算法聚类结果较好,并且用在疫情数据分析上,对安徽省、北京市、福建省、广东省等24个省、市、自治区2020年2月18日新型冠状病毒肺炎确诊人数进行聚类分析,得到的去除离群值在使用k-means算法相比原始数据集进行k-means算法聚类结果较好,该结果能帮助更好地在实际中怎么去做决策以及更好地降低经济损失。  相似文献   

16.
局部切空间排列算法(LTSA)是一种有效的流形学习方法,但该算法对孤立点的存在非常敏感.本文提出了一种快速有效的数据预处理方法-基于改进距离的孤立点检测方法来降低孤立点对LTSA算法的影响.该方法通过改进距离来度量样本点之间的距离,降低了样本点分布不均给孤立点检测算法带来的影响.实验表明,该数据预处理方法能有效地提高LTSA算法的鲁棒性,可以更好的挖掘数据集的本征特性,具有更好的数据可视化效果.  相似文献   

17.
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。  相似文献   

18.
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Based onSquare Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhood and Density based Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的"维灾"。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。  相似文献   

19.
机载单站无源测向定位中,若观测值中存在异常误差,采用EKF算法会导致定位结果有偏。为增强算法抗差性,将抗差EKF算法引入到机载单站无源测向定位中。首先,建立了机载单站无源测向定位模型,依据标准化观测残差构建了抗差等价权矩阵,对异常观测进行降权处理。其次,针对抗差EKF算法效率低的特点,构建了卡方统计量,提出了基于卡方检验的抗差EKF定位算法,即先利用卡方检验判别出含异常误差的观测值,再调用抗差EKF算法进行定位解算。最后,通过在观测值中加入单个异常误差和连续异常误差,测试了算法对不同异常误差的抵抗能力。仿真表明,抗差EKF算法能较好地削弱异常误差对位置估值的影响,并且基于卡方检验的抗差EKF定位算法能提高定位的效率。  相似文献   

20.
孤立点挖掘在教务管理中的应用研究   总被引:2,自引:0,他引:2  
孤立点挖掘是一个重要的知识发现任务,在介绍孤立点及其挖掘算法的基础上,利用孤立点检测方法对教务管理系统中积累的数据进行分析,并提出基于距离和的孤立点检测算法。实验结果分析表明,该算法降低了检测过程对用户设置阀值的要求,在时间复杂度上,稍微优于循环一嵌套算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号