首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对高维数据集中的离群点挖掘任务,给出了一种基于基尼指标和属性相关性分析的高维数据离群点挖掘算法.该算法首先采用属性相关性分析方法,删除高维数据集中的冗余属性,缩减了数据集的大小;其次采用基尼指标作为离群度量因子,从缩减后的数据集中,挖掘出不同离群程度的数据点;最后,实验采用天体光谱数据作为实验数据集,经实验验证,该算法对高维数据集中离群点的挖掘算法是有效的和可行的,其效率得到了明显的提高.  相似文献   

2.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性。  相似文献   

3.
基于局部线性嵌入(LLE)非线性降维的多流形学习   总被引:6,自引:0,他引:6  
为了研究多人脸多表情数据集的多流形学习问题,提出了一种基于局部线性嵌入(LLE)算法的多流形学习方法.对于分布在不同流形上的高维数据,该方法在降维的同时首先对数据集进行非监督的聚类,然后分析每一类数据的低维流形的本质维数以及流形空间的构成,聚类及流形空间的确定是通过对LLE降维的结果进行分析而完成的,计算复杂度小.在Cohn-Kanade人脸表情数据库上的表情识别实验表明,该方法在多人脸多表情流形的学习中优于基本的LLE算法,表情的识别率提高了20%~40%.  相似文献   

4.
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法。该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的 K-means 聚类算法将数据集划分成微聚类,并检测微聚类的离群点。通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度。  相似文献   

5.
针对目前高维数据量急剧增加,离群点检测技术精准度低、所需内存大、检测时间长等问题,提出了基于网格划分和局部线性嵌入方法(Locally Linear Embedding, LLE)的高维数据离群点自适应检测方法.根据高维数据的空间维度进行网格划分,设定单元格邻近单元数量,降低运行开销,减少计算时间.采用局部线性嵌入方法(LLE),分析不同组合数据点的局部特性,准确描述高维数据结构,完成高维数据集预处理.采集高维数据集合中小部分重要信息,保证采集结果的准确性,利用MapReduce编程模型,将大任务划分为多个不同的小任务,展开分布式处理.通过网格密度计算离群度,提升检测效率,优先过滤空白网格单元,降低空间开销,减小所需内存,从而实现高维数据离群点自适应检测.实验结果表明:所提方法在不同数据集大小测试中,执行时间更短,检测精确度更加稳定;在维度测试中,所需内存更少.证明所提方法能够有效降低执行时间和内存,提升检测结果的精确度.  相似文献   

6.
小世界邻域优化的局部线性嵌入算法   总被引:1,自引:0,他引:1  
通过分析稀疏数据或噪声数据,导出局部线性嵌入(LLE)算法出现失效的原因,由此提出了一种基于小世界邻域优化的局部线性嵌入(SLLE)算法.将复杂网络算法引入到流形学习中,利用小世界算法对LLE算法进行数据优化,并以最短路径和局部集群系数作为局部优化参数,解决了数据点不规则时以欧氏空间作为邻域判别标准在构建局部超平面造成嵌入结果扭曲的难题.通过3组标准测试数据集合比较了SLLE、LLE算法,结果表明SLLE算法的计算效果、鲁棒性、非理想数据的降维结果均优于LLE算法,且计算正确率至少提高10%.  相似文献   

7.
针对降维算法局部线性嵌入算法LLE(Local Linear Embedding)未能充分保留高维数据中邻域之间的结构的问题,提出了一种新的融合邻域分布属性的局部线性嵌入算法。该算法通过计算每个样本数据的邻域分布以及KL(Kullback-Leibler)散度度量不同邻域点与其中心样本各自的近邻分布差异,并利用其差值优化重构的权重系数,从而获得更精确的低维电机数据。通过可视化、 Fisher测量和识别精度3个评价结果验证了该算法挖掘电机轴承检测数据高维结构的有效性。  相似文献   

8.
提出一种基于流形距离的局部线性嵌入算法,以流形距离测度数据间的相似度,选择各样本点的近邻域,解决了欧氏距离作为相似性度量时对邻域参数的敏感性.在MDLLE算法中引入最大边缘准则(maximum margin criterion,MMC)来构建最优平移缩放模型,使得算法在保持LLE局部几何结构的同时,具有MMC准则判别能力.通过正交化低维特征向量可消除降维过程中的噪声影响,进而提高算法的监督判别能力.由实验结果得到,所提出的方法具有良好的降维效果,能有效避免局部降维算法对邻域参数的敏感.随机投影独立于原始高维数据,将高维数据映射到一个行单位化的随机变换矩阵的低维空间中,维持映射与原始数据的紧密关系,从理论上分析证明了在流形学习算法中采用随机投影可以高概率保证在低维空间保持高维数据信息.  相似文献   

9.
流行学习是一种新的数据降维方法,能揭示数据的内在变化规律,其目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个有效的低维表示。目前流形学习以其出色的数据约简与可视化能力得到了越来越多模式识别与机器学习工作者的重视。本文介绍了一些常用的流形学习算法,分析了这些算法的优缺点,并利用流形学习中的局部线性嵌入(LLE)算法于头部姿势估计,取得了较好的识别效果。  相似文献   

10.
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。  相似文献   

11.
图集的统一协调,对图集质量有很大影响。本文是作者在编制北京市农业区划地图集的实践基础上,根据地图信息传输论的观点,对农业区划地图集的统一协调的内容及方法进行了探讨。试图总结编制这类图集的统一协调模式,以供读者编图时参考。  相似文献   

12.
研究了国家法的抽象正义观与民间法的情理正义观,认为西方国家法的抽象正义观与东方民间法的情理正义观存在实质的不同,原因在于思维方式、超验与经验传统、政治结构的差别。在现代法治理念下,传统民间法所代表的正义观将向混合正义观转型,西方法治所代表的国家法抽象正义观是其骨架。  相似文献   

13.
给出了一维非自治时滞系统点态退化的一个例子,拓宽了该领域的研究。  相似文献   

14.
利用对位异构体的对称性由核磁共振氢谱测定了工业十二烷基苯在硝硫混酸中的硝化选择性,发现一硝化产物中对位异构体的比例为75% ̄80%。以月桂酸和苯为原料,经氯化、酰化和还原合成了正十二烷基苯。在同样条件下研究了正十二烷基苯的硝化,由核磁共振氢谱和气相色谱分析,发现一硝化产物中对位异构体的比例仅为60%。根据空间位阻效应,对结果进行了讨论,并与甲苯,乙苯,异丙苯等短链烷基苯的硝化结果进行了比较。  相似文献   

15.
YBCO掺杂效应研究   总被引:3,自引:0,他引:3  
介绍了YBCO掺杂的基础知识,总结了YBCO各个位置采用典型元素掺杂而导致的超导电性和结构的变化,阐述了掺杂对YBCO的重要影响,并简介了当前YBCO掺杂效应研究中的几个热点问题.  相似文献   

16.
由于有限群的Lagrange定理的逆不成立,因此,n较大时要确定n次交代群An的所有子群或对An阶数的每一个正因数,确定是否存在这个阶数的子群是较困难的问题.文章通过对5-循环置换各次方幂的计算及其研究,构造出了A5的5个12阶子集,并证明了每一个子集都是A5的12阶子群,最后对A5的部分阶的子群做了总结.  相似文献   

17.
18.
为了找出诱发高频机组基础不良振动的原因,从基础计算模型方面对基础激励与响应进行了分析,以两个高频机组基础为动测实例,经模态分析得出钢筋混凝土构架式基础竖向1阶振动与电机产生共振;应用功率谱法对动力机组及基础平台进行动测,得出平台异常响应频率66Hz为水泵工作频率,调整机器的工作频率可避开不良振源影响,达到明显的减振效果。由此而知,动力机器基础出现不良振动时,不可盲目改变结构的动力特性,应在机器不同工况比如:停机、起机及正常转速下,对机器及基础进行动测并对振动信号进行比较分析,以制定出行之有效的减振方法。  相似文献   

19.
基于“前沿分支”的观点研究了圈幂补图的树宽,首先确定了它的树宽下界,又给出了达到此下界的标号,从而得到了它的树宽表达式。  相似文献   

20.
报告鸡法氏囊病的流行状况,主要症状,剖检情况及诊断,提出了综合性防治措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号