首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
聚类集成的目的是通过集成多个不同的基聚类来生成一个更好的聚类结果,近年来研究者已经提出多个聚类集成算法,但是目前仍存在的局限性是这些算法大多把每个基聚类和每个簇都视为同等重要,使聚类结果很容易受到低质量基聚类和簇的影响.为解决这个问题,研究者提出一些给基聚类加权的方法,但大多把基聚类看作一个整体而忽视其中每个簇的差异....  相似文献   

2.
针对聚类融合问题,考虑了聚类成员的质量和噪声对聚类结果的影响,提出一种加权迭代的聚类融合模型,利用粗糙集理论中的决策表属性重要性的信息熵来衡量聚类成员的重要性,迭代更新聚类成员的权重。该文在模拟和真实数据集上进行了校验。结果表明,该模型能较好地处理聚类成员间的质量差异,并能有效地消减噪声对融合的影响,从而得到更好的聚类融合结果。  相似文献   

3.
针对当前大数据背景下推荐系统中所存在推荐效率低下、扩展性差、推荐质量不高等问题,本文提出一种基于Bregman联合聚类与加权矩阵分解的融合推荐算法(CO-CWMA)。首先,通过Bregman联合聚类挖掘出多样、不同层次的低秩评分子矩阵,组合不同约束与距离的聚类结果训练得到子模型,进而在各个模型的子矩阵上并发地进行矩阵分解,最后将各个子模型进行均值融合,提高推荐质量、效率与扩展性。在矩阵分解阶段采用SVD++算法,基于每个子矩阵中的评分分布计算加权策略,给予高频评分较大权值,在梯度下降阶段利用学习率函数控制学习率的更新。实验结果表明,该算法与三种基线算法相比在均方根误差(RMSE)与平均绝对误差(MAE)上均有明显降低,即推荐质量有较大提升。  相似文献   

4.
提出一种基于网页分类和网页加权的网民聚类算法,其基本思想是:先以各个网民对每个网页的点击量为依据,通过模糊等价矩阵聚类法对网页进行分类,并根据网页内容与深度确定网页的加权,即给每个网页一个分数,最后根据这个加权分数再次对网民进行聚类,即使用两次模糊等价矩阵聚类.  相似文献   

5.
心脏病已成为全世界导致死亡的主要原因之一,心脏病的预测和早期诊断对人类的健康具有重要意义.采用模糊聚类循环迭代模型对心电图进行分析处理,以期给医生提供对心脏病进行预测和早期诊断的辅助手段.描述了系统中使用的模糊聚类循环迭代模型,分析了病症与疾病的模糊关系和关联程度,并给出了实际应用的例子和性能评价.  相似文献   

6.
针对传统的以k-means为代表的分割聚类算法认为所有的聚类样本对聚类中心的影响都是相同的这一观点,提出基于样本加权的聚类算法,并采用实际数据集验证算法的有效性.实验表明,该算法比传统的k-means聚类算法具有更高的精确度.  相似文献   

7.
针对混合属性数据聚类难度高的问题,提出一种基于广义线性模型的混合属性数据聚类方法.首先,构建低阶多元广义线性模型处理海量数据聚类问题,考虑数据属性的时间特性,获取属性时间序列矩阵;然后,基于优化K-prototypes聚类方法处理混合属性数据时,考虑属性的时间序列矩阵;最后,在考虑样本同聚类中心距离基础上兼顾已知样本信...  相似文献   

8.
一种基于加权Parzen窗的聚类算法   总被引:1,自引:0,他引:1  
提出了一种新的基于加权Parzen窗的无监督学习方法 .该方法采用加权Parzen窗获得对数据分布状态的良好描述 ,从而求出不同模式类的分界面 ,并将聚类过程转变为求解加权Parzen窗权值的线性规划问题 .实验表明 ,采用这一方法只需较少的计算时间就可以获得与Asa等人基于支持向量机的方法类似的聚类结果 .  相似文献   

9.
纹理分析方法主要包括统计法、结构法和频谱法。由于不同纹理分析方法的侧重点和适用对象不一样,传统的单一特征分析方法存在一定的局限性。结合统计法和频谱法对纹理进行分析,利用灰度共生矩阵得到纹理的统计特征,应用Gabor变换得到多尺度、多方向的纹理特征,提出一种依据纹理宏、微特性加权的新的特征融合的方法,最后进行K均值聚类得到分割结果。实验结果表明,与传统应用单一纹理分析方法相比,该方法在保持边缘准确性和区域一致性上有一定程度的提高。  相似文献   

10.
在不等精度的测量中或研究分析单参数与综合参数的关系时,人们常给予这些测得值以不同的权,即称加权。加权的权重通常是按经验法来选定的。为减少人为影响因素,提出一种从可测得值中进行模糊动态聚类分析求权的方法,从而提高加权精度,获得与实际一致的效果。  相似文献   

11.
连续属性离散化是数据预处理的关键步骤之一,在实际应用中往往通过高效的启发式算法来计算离散化结果.对基于辅助矩阵和信息熵的两类启发式离散化算法进行实验研究,分别选取每类算法中的5种典型方法,通过系列实验,对两类算法的性能进行对比研究,结果表明:辅助矩阵类算法具有相对较高的样本识别能力,但算法复杂度较高,运行时间更长,较适...  相似文献   

12.
基于粗糙集的属性约简的矩阵方法   总被引:6,自引:0,他引:6  
粗糙集理论中,属性约简是知识挖掘的核心。知识获取是根据对象间的某种关系如等价关系、相似关系等来定义。受关系的矩阵表示的启发,本文提出知识的矩阵表示以及属性约简的矩阵方法,这种表示和约简方法具有形式简单规范、运算工整的特点。实例验证了该方法的合理性和有效性。  相似文献   

13.
基于粗糙集理论的数据挖掘模型   总被引:64,自引:0,他引:64  
提出了一种基于粗糙集理论的数据挖掘模型,以利于信息不完备情况下的推理和决策问题的解决和研究。该模型从已知数据的初始决策系统出发,建立一系列的不同简化层次的子系统,然后推导出各个子系统的规则集,其中每条规则都有相应的置信度。在应用模型进行推理和决策分析时,用给定对象的信息与模型中相应节点的规则进行匹配,然后选用某种评判算法得出结论。给出了一个简单的例子来说明如何建立和应用这种数据挖掘模型。这样的模型可以很方便地根据给定的信息,在最符合的子系统上得出尽可能好的结论。  相似文献   

14.
针对科技项目团队能力评估问题进行了研究,引入粗糙集和信息熵理论,总结以往项目经验,建立了基于粗糙集的团队能力指标评价模型。最后通过实例分析,对该模型的科学性和可行性进行了验证。  相似文献   

15.
基于模糊集和粗糙集理论的故障诊断方法的研究   总被引:1,自引:0,他引:1  
概括介绍了模糊集粗糙集的基本理论,对基于它们的故障诊断方法进行比较,并提出在故障诊断方法中一些可能的研究方向。  相似文献   

16.
基于t-模的广义模糊粗糙集的不确定性度量   总被引:2,自引:1,他引:1       下载免费PDF全文
对于基于t-模的广义模糊粗糙集模型,利用一种新的信息熵研究这种广义模糊粗糙集的不确定性度量。  相似文献   

17.
扩展的粗糙集模型及其不确定性量度   总被引:5,自引:0,他引:5  
为克服标准的粗糙集模型不能表示数据对象的不同重要性和属性的不同特性的局限 ,需对其进行扩展。在可变精度粗糙集的基础上 ,构造了一种新的扩展粗糙集模型。它通过在知识表示系统和决策表中引入数据对象的权值函数和属性的特性函数来克服上述局限。给出了适于数据对象具有不同重要性情况下的粗糙决策规则集合的不确定性量度 ,以其作为规则评价的标准 ,可以方便地融入主观偏好、先验知识等因素。通过对一个数据集的分析实例对此进行了说明  相似文献   

18.
基于可变精度粗集模型的增量式规则获取算法   总被引:1,自引:0,他引:1  
为了获取最小决策规则集,当增加新样本时,传统的方法通常需要对决策表中所有数据重新计算,效率欠 佳.从可变精度粗集模型理论出发,讨论了新增记录与已有条件属性等价类的关系及对规则集的影响,在此基础 上提出了基于可变精度粗集模型的增量式规则获取算法.通过仿真实验表明,这种增量式算法是可行的.  相似文献   

19.
基于可变精度粗集模型的增量式规则获取算法   总被引:4,自引:0,他引:4  
为了获取最小决策规则集,当增加新样本时,传统的方法通常需要对决策表中所有数据重新计算,效率欠佳。从可变精度粗集模型理论出发,讨论了新增记录与已有条件属性等价类的关系及对规则集的影响,在此基础上提出了基于可变精度粗集模型的增量式规则获取算法。通过仿真实验表明,这种增量式算法是可行的。  相似文献   

20.
采用标志气体分析法对煤自燃火灾预报时存在特征维数较高、特征之间存在冗余及人为划分温度段的不合理性等问题,文中提出基于粗糙集和聚类的采空区煤自燃火灾预报方法。即使用粗糙集对原始样本去除冗余和特征维数约简,再用聚类方法对约简后的特征进行聚类得到各温度段的特征中心,并使用模式识别的方法,确定出煤自燃标志气体特征其与温度段特征中心的相似性,从而实现采空区遗煤自燃状态的识别和早期预报。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号