首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
数据驱动的定量规律发现技术研究   总被引:2,自引:2,他引:2  
为了解决现有定量规律发现技术存在的发现范围狭窄,对噪声过于敏感,很难用于含干扰较大的实际观测数据等问题,将回归技术引入化简算法,提出了一个基于化简算法,原型回归和假说验证的多元函数规律发现的框架,根据该框架建立的知识发现系统,可用于发现蕴含于含有随机噪声的多变元观测数据中的数量规律。  相似文献   

2.
数据相关性分析是开发程序并行性最重要的技术之一 ,但是传统的自动数据相关性分析难以处理实际应用程序的复杂情况 ,而且 ,程序中固有的语义信息也无法为并行化工具所理解。这种状况限制了现有并行化系统的并行效果。一种新技术——交互式数据相关性分析可以改善这一状况 ,其中核心的数据相关性信息提取模块能够将自动数据相关性分析所得的不确定性结果转化成一些简单的问题并提交给用户 ,从而使用户与并行化工具紧密合作 ,改进数据相关性分析的结果 ,进而提高并行化系统的能力。交互式数据相关性分析技术已在清华大学开发的 TIPS并行化系统中实现了。  相似文献   

3.
在交互式多模型和概率数据关联算法融合的基础上,又将自适应采样速率算法融合到交互式多模型概率数据关联滤波器中,提出了自适应采样速率交互式概率数据关联算法,该算法不但能有效地跟踪高速机动的目标,且能使系统的采样间隔根据目标的运动状态做自适应调整. 仿真结果表明该算法扩大了机动目标的跟踪范围,且对高速机动的目标有很好的跟踪效果和较强的跟踪精度.  相似文献   

4.
传统大数据交互式查询技术忽略了对大数据融合步骤,导致该技术的交互查询效果不理想,且准确度偏低.为此,提出基于改进深度学习算法的大数据交互式查询技术.以教务系统为研究对象,构建教务系统交互大数据的粗糙量化特征分析模型,基于联合自相似性特征解析控制方法实现对教务系统交互大数据信息融合和特征匹配,从而提取教务系统交互大数据的...  相似文献   

5.
随着交互式有线电视系统的发展,在有线电视网络中进行数据加密来维护使用的正当权益势在必行,对目前采用的加密算法进行了分析,并由此对交互式有线电视网络中的采用加解密算法的机制进行了探讨。  相似文献   

6.
针对水声目标小样本识别中样本数目有限而特征数目不断增加,导致分类系统分类性能下降的问题,提出了一种新的自适应免疫特征选择算法(AIFSA).该算法先利用先验知识生成初始种群,接着利用交叉、变异和新的自适应免疫算子指导种群进化,每代中对分类贡献大且选择特征数目少的个体适应度值高.AIFSA具有可以利用先验知识、收敛速度快以及优化特征子集维数小的优点.提取了实测4类水声目标的多域特征,进行特征选择和分类识别仿真实验,结果表明:AIFSA可以选择有效特征子集,在特征维数下降60%的情况下,支持向量机分类器的平均正确分类率下降很小;AIFSA与标准遗传算法相比,收敛快、稳定,所得优化特征子集具有更高的正确分类率和更好的范化性能.  相似文献   

7.
点云数据特征点提取方法的比较   总被引:1,自引:0,他引:1  
点云特征的提取在城市、地质等领域有非常重要的使用价值。特征点是最基本的几何特性和纹理特征的特征基元,其不会因为坐标系的改变而发生变化。通过用不同的方法提取点云数据中的特征点,可以在减少计算量的前提下,保留点云的几何特征。通过对利用法矢、曲率和体积积分不变量3种不同的特征点提取方法进行比较,并通过Matlab进行特征点提取实验并分析情况,对其优缺点及适用性进行探讨。  相似文献   

8.
为提高网页数据查询速度、精度及工作效率,提出一种面向用户偏好的动态网页数据交互式查询算法.首先,构建用户偏好模型,增加偏好组合的演化个体适应性,综合计算适配值;其次,为防止数据冗余和重复,基于兴趣相似性,分离相似度高的查询数据和重复数据,识别出网络数据的性质;最后,利用粒子群优化算法寻找最优的动态网页数据交互式查询方案.实验结果表明:在数据集基数影响下,该算法的查询结果集质量在0.95以上;在查询最大维数影响下,该算法的查询结果集质量在0.96以上,表明其查询使用时间短、结果集精度高、自适应能力强.  相似文献   

9.
超参数优化问题一直是自动化机器学习研究的重点问题,针对特定的需求建立机器学习模型,需要调整大量的超参数。其中,超参数组合形成了大规模的超参数搜索空间,从而需要大量的运行时间。然而,有效探索大量超参数组合具有一定的挑战,现有的自动化超参数优化方法时间复杂度很高。为此,利用相似数据集的最优超参数区间的历史知识,提出了一种基于数据集元特征的超参数优化方法。首先,使用自动化机器学习系统寻找最优超参数的区间范围,然后对历史数据集元特征采用递归特征消除法进行特征提取作为特征向量,将此特征向量与最优超参数区间的对应关系利用XGBoost算法建立预测模型,并使用该模型预测新数据集的最优超参数区间。对OpenML平台的数据集进行实验,结果表明该方法预测的最优超参数区间的精度达87%。同时,把此预测区间作为自动化机器学习系统的搜索空间范围,在很大程度上缩短了运行时间,且确保一定的性能。  相似文献   

10.
刘洋 《科技信息》2007,(3):54-54
文本分类的主要任务是在预先给定的类别标记集合下,根据文本内容判定它的类别。特征选择是文本分类中的一个重要环节。本文对文档频率(DF)、信息增益(IG)、互信息(MI)、x2统计量(CHI)四种特征选择方法在中文语料上进行了性能比较。实验结果表明IG方法较其它三种方法有一定的优势。  相似文献   

11.
为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度.  相似文献   

12.
由于不同来源或不同时间,导致了同一地物在存储方式或属性等方面存在着很多差异,这给后期的数据处理和使用带来了诸多不便,因此矢量空间数据匹配已经成为了关键性问题。提出了一种基于栅格化的线状矢量数据匹配方法,其主要思想是对线状矢量数据栅格化,利用SVM(Support Vector Machine, SVM)算法提取出所要研究的数据,然后利用Harris算子提取特征点,用SIFT(Scale-invariant feature transform,SIFT)算法计算特征向量并对其进行匹配,最后把匹配结果转换为矢量数据。该算法不受平移、旋转、缩放、明亮度变化等的影响,弥补了矢量匹配过程中因数据旋转等问题而无法匹配的不足,将矢量数据栅格化处理,使其数据结构更简单,操作容易,更易于算法的实现。提出了一种基于栅格化的线状矢量数据匹配算法,实现了对道路的匹配。  相似文献   

13.
微阵列数据具有样本小、维度高的特点,给数据分析带来了困难。因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的。本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比。利用挑选出的主基因,采用支持向量机(SVM)对数据样本进行了分类研究。通过实验,在经典的白血病数据集上,对于34个样本的测试集,达到了33/34的分类准确率,表明了本方法的适用性。  相似文献   

14.
基于高维数据的特征选择性, 运用功能扰动集成方法, 对4种不同特征选择器的结果进行集成, 得到了分类精度高且稳定性较好的特征子集.  在基因数据集上与原有算法进行性能对比实验, 结果表明, 多特征选择混合算法可使特征选择的结果间具有互补性, 从而有效提高特征选择的稳定性和分类精度.  相似文献   

15.
针对目前癫痫自动检测算法多集中于为单个患者建立检测模型,泛化能力较弱的问题,提出一种基于机器学习的跨患者癫痫自动检测算法.该算法使用多个癫痫患者的脑电数据,先对数据进行预处理后分析脑电数据间存在的特征,再对特征进行筛选,训练出一个跨患者的癫痫自动检测模型.该算法不需为每个患者建立单独的检测模型,实现了仅使用一个检测模型...  相似文献   

16.
文本聚类的关键是对高维的特征集进行降维.本文对常用的一些特征选择、特征抽取等主流特征降维方法进行了介绍,分析了它们各自的特点及其适用范围.  相似文献   

17.
为了获得更多的信息,越来越多的数据利用多路传感器进行采集,由此产生了大量的超高维时间序列。特征的提取在处理和传输这些数据中起到至关重要的作用。为此,提出一种最优鉴别平面(ODP)技术以消除数据冗余。该平面由两个在Fisher准则基础上建立起来的相互垂直的矢量组成,将模式样本投影到ODP上可得到二维特征矢量。为了衡量特征的有效性,分别用二次判别函数分类器和阈值矢量分类器对特征进行分类测试。同时,以心电信号为例对ODP方法进行测试,结果表明,该方法应用于超高维数据的特征提取是行之有效的。  相似文献   

18.
针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势.  相似文献   

19.
为解决利用机器学习算法在线生成电网运行断面时所面临的特征因素“维数灾”问题,提出了一种基于两层模式的电网运行断面特征选择与在线生成方法。上层为过滤式特征选择层,采用Fisher分和信息增益两种特征选择指标对初始因素集进行筛选,重点剔除重复因素和无关因素,输出基础因素集。下层为包裹式特征选择层,利用序列后向搜索算法,进一步分析电网运行断面与运行参数之间的内在关系,生成特征因素集,同步形成基于该特征因素集的运行断面生成智能体。基于某地区电网实际数据构造的算例表明,本文方法能大幅降低特征因素“维度”,与初始因素集相比缩小90%以上,基于该特征因素集的智能体能在10秒中内在线生成运行断面,准确性评价指标达到95%,能够满足电网实时运行控制辅助决策的需要。  相似文献   

20.
特征提取与多目标机器学习研究及应用   总被引:1,自引:0,他引:1  
特征提取与多目标机器学习算法是基于多目标协同EA提出的,该算法通过对学习样本多属性进行特征提取找出其核属性,由核属性与其他非核属性组成属性组,从而提高了分类的精度。各属性组再按相似性和类标签进行有监督地聚成类簇,类簇个数和中心根据适应度矢量函数通过机器学习算法自动确定,这样类簇个数和中心就不受主观因素的影响并且保证了这两个关键要素的优化性质。待分类样本的类属是按离某个类簇中心距离最近邻法则和该类簇的类标签来判定。最后,将算法应用到UCI数据集中的Liver Disorders和Hepatitis两个数据集,以及浙江省北部地区夏天异常高温天气预测。通过实验表明,特征提取与机器学习算法优于著名的朴素贝叶斯、C4.5、SVM算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号