首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
为实现同时利用属性信息和结构信息完成更精确的协同聚类, 提出一种基于属性异构信息网络的半监督协同聚类框架(SCCAIN). 首先, 设计一种可学习的整体关联度量, 其通过元路径和属性投影整合结构关联和属性关联; 其次, 将约束负矩阵三因式分解引入到具有约束的协同聚类节点中, 将相关性度量和协同聚类相结合, 以协同聚类结果作为共享因子, 并提出一个统一的半监督学习框架, 以联合优化协同聚类和相关性测量给定的约束; 最后, 在不同的数据集上进行仿真实验, 实验结果表明, 该方法聚类效果较好, 从而验证了属性信息和结构信息对能提升协同聚类效果.  相似文献   

2.
目前的高属性维稀疏数据算法大多面向二态数据,而且没有聚类结果的评价方法,给应用带来很大局限。针对这些问题,给出一种基于信息粒度的高属性维聚类算法。首先通过设计面向数据稀疏特征的半模糊聚类算法对数据进行离散化,并基于此给出稀疏相似度和初始等价关系的定义,然后设计可变精度的二次聚类模型对初始聚类结果进行修正,使算法具有较强抗噪声能力,最后结合应用领域定义一种新的聚类质量的评价模型。实验证明,算法具有更广应用性,可提供多粒度分析结果,准确度更高,得到的聚类结果能真实反映数据的特征。  相似文献   

3.
目前的高属性维稀疏数据算法大多面向二态数据,而且没有聚类结果的评价方法,给应用带来很大局限.针对这些问题,文中提出了一种基于知识粒度的高属性维聚类算法.首先通过设计面向数据稀疏特征的半模糊聚类算法对数据进行离散化,并基于此给出稀疏相似度和初始等价关系的定义;然后设计可变精度的二次聚类模型对初始聚类结果进行修正,使算法具有较强的抗噪声能力;最后结合应用领域定义一种新的聚类质量评价模型.实验证明,该算法可提供多粒度分析结果,准确度更高,得到的聚类结果能真实反映数据的特征.  相似文献   

4.
在数据发布过程中,如果对发布的敏感属性信息不进行任何保护处理而直接发布,容易遭受攻击导致隐私信息泄露.针对传统的单敏感属性隐私保护方法在多敏感属性中不能得到很好的隐私保护效果,提出了一种基于多敏感属性相关性划分的(m,l)-匿名隐私保护模型.利用信息增益法对多敏感属性的相关性进行计算并划分,降低敏感属性维度;根据(m,l)-diversity原则对敏感属性分组,保证发布的数据能防止偏斜性攻击,并且在一定程度上降低背景知识攻击的风险;采用聚类技术实现该模型,减小该模型产生的附加信息损失和隐匿率,确保发布的数据具有较高的可用性.实验结果表明,基于多敏感属性相关性划分的(p,l)-匿名隐私保护模型具有较小的附加信息损失和隐匿率,保证了发布数据的可用性.  相似文献   

5.
对Web日志进行有效聚类,可得到网站不同访问群和访问模式,研究了Web用户群模糊聚类关键技术.因为Web数据既有定量属性,又有定性属性,对Web用户群的聚类挖掘采用了模糊聚类方法,并设计了基于用户群的页面推荐函数.试验证明,Web用户群模糊聚类挖掘方法是有效的.  相似文献   

6.
为克服核模糊属性c-均值聚类算法易陷入局部最优解的缺点,提出一种新的基于粒子群优化的核模糊属性c-均值聚类算法.该算法根据核模糊属性c-均值聚类准则设计适应度函数,利用粒子群优化算法对聚类中心进行优化,在粒子迭代进化过程中采用动态调整学习因子,提高算法的优化性能.实验表明,本文算法优于单一使用核模糊属性c-均值聚类算法和基于粒子群优化的核模糊c-均值聚类算法,也优于目前常见的典型聚类算法.  相似文献   

7.
考虑到不同属性之间的重要性,利用粗糙集理论对模糊信息表或信息表中的不同属性之间(特别是定量属性与定性属性之间)进行耦合,提出一种计算不同属性间相似度的计算方法,即基于粗糙集属性重要性的模糊聚类方法,解决模糊信息表或信息表中属性值定量与定性描述并存情况下的聚类问题,并根据原类结果建立决策表.  相似文献   

8.
针对目前基于K-Means算法的入侵检测技术所存在的符号类型数据处理能力欠缺、误报率较高的问题,提出了一种基于聚类和关联规则修正的入侵检测技术。将关联规则挖掘技术引入到聚类分析机制中,利用针对符号型属性的关联规则挖掘结果对聚类结果进行修正,从而有效降低由于在入侵检测单纯使用聚类分析所导致的误报。详细阐述了改进的具体实现方案,并通过实验验证了该技术的可行性。  相似文献   

9.
针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进行实验,实验结果表明,该改进算法能够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现.  相似文献   

10.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.  相似文献   

11.
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

12.
To solve the problem of information fusion from multiple sources in innovation alliances, an information fusion model based on the Bayesian network is presented. The multi-source information fusion process of innovation alliances was classified into three layers, namely, the information perception layer, the feature clustering layer,and the decision fusion layer. The agencies in the alliance were defined as sensors through which information is perceived and obtained, and the features were clustered. Finally, various types of information were fused by the innovation alliance based on the fusion algorithm to achieve complete and comprehensive information. The model was applied to a study on economic information prediction, where the accuracy of the fusion results was higher than that from a single source and the errors obtained were also smaller with the MPE less than 3%, which demonstrates the proposed fusion method is more effective and reasonable. This study provides a reasonable basis for decision-making of innovation alliances.  相似文献   

13.
在运用聚类的思想对云资源进行分类时,资源属性的信息熵能反映资源属性在聚类过程中的重要程度。将信息熵的思想运用到K—mean聚类中,提出基于QK—mean聚类的任务调度算法,即对云资源按照属性的重要程度逐一进行K—mean聚类,把任务的调度过程转化成在资源K叉树中查找合适的“叶子”节点的过程。实验证明,该任务调度算法能够有效提高云任务调度的效率。  相似文献   

14.
提出了一种基于启发式群聚算法的机器人全局任务调度策略,在任务划分阶段采用一种启发式群聚算法对随机划分的各子任务按能否使总的运行时间缩短进行各子任务间的聚合,以使各子任务粒度和相互之间的通讯量达到一种优化状态,并在此基础上对群聚之后的各子群任务采用集中式动态调度策略,在程序运行过程中实现各处理器的负载平衡,提高各处理器的利用率,缩短总的运行时间.在一个由5个DSP(digital signal processor)处理器组成的同构型松耦合MIMD(multi instruction multidata)并行处理平台上,对平面四自由度连杆机器人在关节锁定下的运动控制任务采用上述先随机划分,再聚合,最后集中式调度的方法进行了并行实时仿真实验,取得了满意的并行性能指标.  相似文献   

15.
针对基于流形正则化自表示(MRSR)的无监督特征选择算法直接从原始的样本空间构造相似矩阵可能会 导致重构空间中样本的相似性描述得不够准确的问题,提出了基于自适应流形正则化自表示的无监督特征选择 (AMRSR)算法。 基于自适应流形正则化自表示的无监督特征选择算法在 MRSR 算法的基础上通过对相似矩阵施 加概率最近邻约束将相似矩阵的学习嵌入到优化过程中,在重构空间中自适应地学习样本的相似性,使得在每一 次迭代中获取更加精确的样本局部几何流形结构,从而选择具有代表性且保持局部几何流形结构的特征。 最后, 在四个公开数据集上进行了大量的对比实验,通过将算法的特征选择结果用于 K-means 聚类并采取两种常见的聚 类评价指标:聚类精确度和归一化互信息评价聚类效果。 实验结果表明,AMRSR 算法与现有的一些算法相比有更 高的聚类精确度和归一化互信息,进一步表明该算法特征选择效果更好。  相似文献   

16.
概述了网络舆情内容分析的流程以及内容分析阶段需要完成的工作,详细介绍了基于知识技术的网络舆情内容分析系统框架的构建路径,即将知识技术引入网络舆情内容的分析过程,将信息预处理、信息聚类和分类、倾向性分析等关键技术手段与知识组织、知识表示、知识获取和知识挖掘等相关成果充分融合,将本体论和语义计算等技术与舆情分析相结合,建立基于知识技术的网络舆情内容分析框架,以提高网络舆情内容分析的准确度. 实验结果表明,基于知识技术的网络舆情内容分析系统达到了理想效果.  相似文献   

17.
针对网络评论中普遍存在的负面评论较少而影响力却较大的类不平衡问题, 提出一种基于类不平衡学习的情感分析方法. 该方法利用深度学习训练过程中的概率输出, 以计算样例的信息熵作为影响因子构建交叉信息熵损失函数. 在IMDB公开数据集上进行实验验证的结果表明, 基于集成信息熵损失函数的双向长短期记忆网络能处理类不平衡问题; 对数据的统计分析结果表明, 该策略能提升基于双向长短期记忆网络的评论情感极性分类性能. 针对AUC(area under curve)指标, 使用集成信息熵损失函数的双向长短期记忆网络模型比未考虑类不平衡的深度学习模型在中位数上最多提升15.3%.  相似文献   

18.
由于右心室具有易变、壁薄、边界不明显等特点,Atlas成为近年来流行的图像分割方法.针对现存的Atlas选择方法大多基于配准后选择最优的Atlas,比较耗时并且降低了分割性能,提出了利用仿射传播聚类算法进行Atlas选择的方法.首先,将所有的Atlas图像看作一系列数据点,通过数据点之间的消息传递聚类;然后,得到的聚类中心图像和目标图像经过配准得到形变标记结果,采用STAPLE融合策略融合;最后,对融合结果以相似性测度因子为依据进行排序,而用相似性测度因子值最大的聚类中心进行配准分割.重复以上过程,直到得到较精确的分割结果.实验结果表明,提出的方法能有效地进行右心室的分割,与传统选择方法相比,分割精度得到了明显提高.  相似文献   

19.
提出了一种基于簇特征的文本增量聚类算法:充分利用简单、有效的k-means算法来进行初始聚类,并保留聚类后每个簇的簇中心、均值、方差、文档数、3阶中心矩和4阶中心矩作为该簇的簇特征,当出现新增数据时,利用初始簇的簇特征对新增数据进行聚类.在20newsgroups数据集上的实验结果表明:相比于对整个数据集进行重新聚类,该算法具有一定的优势.  相似文献   

20.
本文主要从Blog与RSS技术的整合角度,来探讨如何提高Blog与RSS技术在网络教学中的有效性。结合Blog的创作发布、社会化网络、RSS聚合等功能,并在Blog中整合RSS阅读器,订阅教学资源和网络资源,使得信息的发布、管理、检索、控制、交流、共享变得简单、方便、有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号