首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 198 毫秒
1.
目前的高属性维稀疏数据算法大多面向二态数据,而且没有聚类结果的评价方法,给应用带来很大局限。针对这些问题,给出一种基于信息粒度的高属性维聚类算法。首先通过设计面向数据稀疏特征的半模糊聚类算法对数据进行离散化,并基于此给出稀疏相似度和初始等价关系的定义,然后设计可变精度的二次聚类模型对初始聚类结果进行修正,使算法具有较强抗噪声能力,最后结合应用领域定义一种新的聚类质量的评价模型。实验证明,算法具有更广应用性,可提供多粒度分析结果,准确度更高,得到的聚类结果能真实反映数据的特征。  相似文献   

2.
降维作为聚类问题的关键预处理步骤被用来抽取高维数据潜在的低维子空间结构.面对高维数据聚类,传统的策略是首先采用降维技术提取高维数据嵌入在低维空间的潜在数据结构,然后利用一个聚类算法完成数据聚类.然而,这种两阶段优化策略的聚类性能往往不如直接优化统一的目标函数.因此,在模糊聚类算法的基础上,本文提出了一种稀疏约束的嵌入式模糊均值聚类算法(EFSC),该方法结合线性正交投影技术在对高维数据降维的同时完成聚类.EFSC模型对模糊矩阵施加了稀疏约束来提升聚类性能.理论分析与实验结果证明了本文提出的EFSC算法的有效性.  相似文献   

3.
针对分类数据,基于属性分组技术和多目标聚类质量函数,提出一种子空间聚类算法.该算法采用属性分组技术,将高相关属性划分到同属性组中,利用同组属性相关性度量属性权重值,构建属性软子空间;采用基于多目标的聚类质量函数,判断整体聚类效果,通过迭代优化簇集结构,达到最佳的数据划分状态.在人工合成数据集和UCI数据集上,实验验证了该算法的正确性、高效性和可靠性.  相似文献   

4.
基于邻接距离属性动态聚类算法采用能综合反映属性名称相似性和语义相似性的“邻接距离”,提高了属性匹配的准确率;以类内损失、类间损失之和最小化为准则,使用动态聚类算法对相似属性进行匹配,不需要设置聚类参数,避免了人为造成的误差。  相似文献   

5.
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低。讨论了利用MapReduce对这类数据集进行并行聚类的方法,提出了基于MapReduce的抽样-忽略子空间聚类算法(sample-ignore subspace clustering using MapReduce,SISCMR)。该算法将串行聚类算法用作插件,具有很好的通用性。在人造和真实数据集上进行了大量实验,其中最大为0.2 TB的数据集在128个核心的集群中仅用不到10 min就完成了聚类,验证了该算法良好的聚类质量、近线性的可扩展性和高效的聚类性能,证明了基于MapReduce的并行聚类的可行性。  相似文献   

6.
针对目前决策表属性约简的计算问题,研究了粗糙集理论中差别矩阵,讨论了知识粒度与信息量、类别特征矩阵之间的关系,利用知识粒度最大的属性生成较小的类别特征矩阵,设计了新的启发式规则来快速缩小搜索空间和最小化属性选择,提出了一个基于知识粒度的最小属性约简算法,并用一个实例证明了算法的正确性。与类别特征矩阵相比,采用知识粒度生成的类别特征矩阵可以有效地减少存储空间。实验结果表明,所提出的算法能够得到最小属性约简。  相似文献   

7.
提出基于集合差异度的聚类算法. 算法通过定义的集合差异度和集合精简表示,直接进行一个集合内所有对象总体差异程度的计算,而不必计算两两对象间的距离,并且在不影响计算精确度的情况下对分类属性高维数据进行高度压缩,只需一次数据扫描即得到聚类结果. 算法计算时间复杂度接近线性. 实例表明该算法是有效的.  相似文献   

8.
黄力明 《镇江高专学报》2000,13(4):69-71,85
基于对属性均值聚类算法和求解全局优化问题的方法的分析,提出了基于模拟退火算法的属性均值聚类算法。数值计算表明该算法是一个具有全局最优解的聚类方法。  相似文献   

9.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

10.
针对基于密度的带有噪声空间聚类分析(DBSCAN)的不足,融合了领域知识和划分思想,提出了属性维划分的概念,并论证了基于局部簇合并与核心点计算的剪枝原理,最后结合云计算编程模式MapReduce的特点,给出了DBSCAN的优化方法,并在实际道路运输信息系统数据的聚类分析中得到应用验证.实践证明划分后的数据集易于实现并行聚类数据挖掘,文中优化方法优于一般的统计分析方法.  相似文献   

11.
针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的数据点作为聚类中心,将与该聚类中心相似度大于阈值卢的所有数据点聚集形成数字颗粒结构.在整个聚类过程中无需调整每个数据点的熵值,缩短了计算时间,同时利用粗糙集的不可分辨关系形成字符颗粒结构,通过不断调整、合并这两种颗粒结构,实现了具有混合属性特征数据的聚类分析.实验结果比较表明,该算法是有效、可行的,当卢取值为0.8时,算法的聚类有效性最大值可达0.96,该值较同条件下的其他聚类算法要高。  相似文献   

12.
在现有的稀疏子空间聚类算法基础上提出了一个改进的稀疏子空间聚类算法。首先,利用高维数据可以通过同一子空间的低维数据稀疏地表示这一理论,建立一个稀疏最优化模型,获得稀疏矩阵。然后把稀疏矩阵应用到一个正则化谱聚类算法中,从而有效地把数据聚类到子空间中。最后,该算法应用到一个视频序列中,对每个视频帧里的运动物体进行识别,并与现有的子空间聚类算法相比较。实验结果表明,该算法能够有效地识别运动物体,具有良好的实时性和有效性。  相似文献   

13.
在聚类过程中数据可能呈现稀疏性,如果仍用传统的欧式距离作为聚类指标,则聚类的质量和效率将会受到严重的影响。受到信息论中KL(Kullback-Leibler)散度的启发,采用基于KL散度的相似性度量方法,先描述数据的整体分布,进而对数据进行聚类。研究结果表明,最后通过实验验证本算法的有效性。这种方法可以利用簇中元素提供的信息来度量不同簇之间的相互关系,克传统欧式距离的缺点,提升算法准确度。  相似文献   

14.
社交性软件平台上进行隐性知识攫取,它是否影响隐性知识转移效果以及在何种条件下如何影响隐性知识转移效果,是该问题研究的关键.文章研究在社交性平台下将企业已有知识作为已标注的专业领域知识,通过它引领员工学习并给出评述性标注,形成新知识(隐性知识).新知识再次归集到企业知识库中,继续被循环标注使企业知识集不断创新和积累.研究中为了提高自由标注到隐性知识的显性化效率,设计基于企业专业知识为集合划分的集合中心半聚类算法,其在每项评价函数上的数据比传统算法都优秀.  相似文献   

15.
16.
车牌自动识别技术对完善收费系统功能,杜绝逃漏费现象,减轻收费人员的劳动强度等有重要意义.结合相容粒度空间处理模糊数据的理论,提出了基于相容粒度的车牌分割和识别算法,有效分割出车牌字符,并从字符库中校对识别字符.实验结果表明,该方法比传统方法速度更快更准确,对车牌图像清晰度要求低.  相似文献   

17.
研究了问题求解的粒度理论在布局求解中的应用。综合约束问题求解和回溯控制策略,给出了在粒度分层模型基础上的布局算法,以往采用单一粒度模型的布局算法,由于粒度过粗或过细,不能充分利用各种约束来降低求解复杂度。文中提出的算法采用了粒度分层模型,能够利用设计过程不同阶段的约束,来缩小合适解的范围,通过多层面的约束,降低求解的复杂度,克服了以往布局算法的缺陷,通过一个住宅布局设计的实例分析了该算法的运行过程  相似文献   

18.
该文提出了一种基于全局-局部结构保持的稀疏投影模型(GLSPP).通过对投影数据进行线性重构来保持数据的全局结构,从而保留投影数据的全局信息.通过约束重构系数矩阵与相似性矩阵的相似性来保持全局保持数据和局部保持投影数据的一致性.同时,对重构系数矩阵和相似性矩阵进行稀疏约束,保留主要信息,以减少冗余信息的干扰.在公开的4个人脸与物体数据集上的实验结果显示:该方法具有较高的分类准确率.  相似文献   

19.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号