首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
传统流形学习算法虽然是一种常用的有效降维方法,但由于其自身计算结构的限制,往往存在数据分析不足和计算时间较长等问题.为此提出一种基于谱聚类的流形学习算法(spectralclustering locally linear embedding,SCLLE),并对其机理以及优点给予了实例证明.在UCI和NCBI数据集上的实验结果表明,该算法具有较好的识别效果和计算性能.  相似文献   

2.
首先介绍单视角谱聚类算法的原理,在此基础上,研究谱聚类在多个视角框架下的应用,同时也研究了多视角谱聚类算法在大数据中的应用,最后对多视角谱聚类算法研究方向进行总结.  相似文献   

3.
针对分类数据,基于属性分组技术和多目标聚类质量函数,提出一种子空间聚类算法.该算法采用属性分组技术,将高相关属性划分到同属性组中,利用同组属性相关性度量属性权重值,构建属性软子空间;采用基于多目标的聚类质量函数,判断整体聚类效果,通过迭代优化簇集结构,达到最佳的数据划分状态.在人工合成数据集和UCI数据集上,实验验证了该算法的正确性、高效性和可靠性.  相似文献   

4.
基于内存的协作过滤算法主要利用用户对某站点项目的评分,计算2个用户之间的相似性,但该方法可扩展性差.基于模型的协作过滤算法通过训练数据预先计算出预测模型,弥补了上述方法的不足,但该模型没有考虑到个体的差异而限制了推荐的性能.在总结现有2种算法特点的基础上,提出一种新颖的协作过滤框架,它先从训练集中产生聚类,并以此为基础进行邻居预选择,再在预选择的邻居集合上使用基于内存的协作过滤算法.实验结果表明,该方法不仅提高了计算的效率,而且也提高了推荐的质量.  相似文献   

5.
通过分析现有的协作过滤技术,提出了基于矩阵聚类的协作过滤算法,把矩阵聚类算法和协作过滤相结合,自动划分原始用户———资源评分矩阵,依据划分后的子数据矩阵生成推荐结果.实验结果表明,提出的基于矩阵聚类的协作过滤算法优于传统协作过滤算法,减少了近邻搜索范围,提高了算法的推荐精度.  相似文献   

6.
文档聚类和词聚类都是重要且被充分研究的问题.大多数现有的聚类算法针对文档和词是分别聚类,不是同时的.本文提出文档集作为文档和词间的一个二部图的模型思想,使用这个思想,联合聚类问题可以被看成二部图的分割问题.为了解决图的分割问题,使用一个新的联合谱聚类算法,即使用适度规模的词-文档矩阵的奇异向量产生好的分割结果.谱算法得到一些最佳的性能,表明奇异向量通过连续放松解决图划分的NP难问题.最后通过实验结果验证联合聚类算法在实践中非常有效.  相似文献   

7.
针对基于对象的图像检索问题,提出一种新的谱聚类多示例学习算法.该算法将图像当作包,将分割区域的视觉特征当作包中的示例,针对正包示例集合进行谱聚类,按聚类中心点数最大原则选择潜在正示例中心和潜在正示例代表,并采用径向基函数和金字塔核分别度量潜在正示例间和其它示例间的相似性,最后利用支持向量机和相关反馈实现图像检索.采用S...  相似文献   

8.
柳炳祥 《科学技术与工程》2013,13(19):5536-5542
提出了一种新的基于双重采样的选择性集成学习算法。针对集成学习要求学习器个体的差异性分布在样本空间的不同部分,对得到的聚类个体学习器输出进行重采样,以此来计算聚类个体的差异性。针对集成学习要求得到的个体学习器具有一定的精确性,对所有得到的学习器个体集合进行重采样来评估聚类个体精确性。在此基础上选择出集成学习所需的个体集合。以谱聚类算法作为基学习器,用聚类集成策略部分解决了谱聚类算法存在的尺度参数敏感问题,在UCI数据集上的仿真实验验证了算法的有效性。  相似文献   

9.
协作学习中协作小组分组系统的设计与开发研究   总被引:3,自引:0,他引:3  
根据协作学习中学习者的关键特征类型,以异质分组为原则,设计了适用于计算机网络环境下的自动分组模型,给出了分组算法关键技术,进而采用PHP+Apache+MySQL组合技术开发了协作学习小组分组系统.该系统支持协作小组分组的自动实现,具有自主分组、异质分组、随机分组和同伴关系分组等功能.该系统为协作学习提供了一个自动分组的支撑环境,是CSCL教学和研究的一种有效支持工具.  相似文献   

10.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行.  相似文献   

11.
针对谱聚类算法在处理较大规模的样本时,在存储空间和计算时间上都存在瓶颈问题,文章分析了目前常见的两种解决方式,即基于稀疏化t近邻的谱聚类和基于Nystr9m矩阵低秩逼近的谱聚类方法.为了进一步提高这两种谱聚类算法的准确度,提出了采取基于信息熵属性赋权的欧式距离来计算样本间的相似度的方法.首先,计算样本各属性的权重;然后,计算样本间的相似度矩阵并应用到稀疏化t近邻的谱聚类和Nystr9m矩阵低秩逼近的谱聚类方法中;最后,在多个数据集上进行了验证.实验结果表明该方法在一些数据集上的聚类精确度要比原来谱聚类算法高,尤其在Pendigits数据集上,基于信息熵赋权的稀疏化t近邻谱聚类比稀疏化t近邻谱聚类方法精确度提高15.11%.  相似文献   

12.
硬聚类要求聚类的结果必须具有清晰的边界,即每个对象要么属于一个类,要么不属于一个类.然而,将某些不确定的对象强制分配到某个类中往往容易带来较高的决策风险.三支聚类将确定的元素放入核心域中,将不确定的元素放入边界域中延迟决策,可以有效地降低决策风险.本文将三支决策理论与传统的谱聚类算法相结合给出了三支谱聚类的聚类算法.该方法通过修改谱聚类算法的聚类过程并获得任一类簇的上界.然后通过扰动分析从该类簇的上界分离出该类簇的核心域,同时上界与核心域的差值认为是该类簇的边界域.在UCI数据集上的实验结果显示,该方法能有效提高聚类结果的ACC、AS、ARI值,并且降低DBI值.  相似文献   

13.
廖定安 《科技信息》2012,(10):117-118
当今企业信息组织结构中,存在多个数据集各自独立而又相互协作影响的情况。考虑来自多个数据集的影响,比从独立的数据集挖掘出的知识更能反映现实的数据结构。对这些数据集采用数据挖掘协作分析是很有必要的。本文提出并设计了基于聚类的信息协作分析模型。首先对信息协作分析给出定义,随后给出设计的模型,并对具体的模型分析过程进行了讨论。  相似文献   

14.
谱聚类是一种无监督学习方法,在许多环境中都能高效地进行应用,且易于实现,已经成为非常流行的聚类算法之一.然而谱聚类仍面临两个主要的问题:(1)如果数据量过大,在对拉普拉斯矩阵进行特征分解时,需要大量的计算;(2)k-means在面对大量数据时也会有计算时间过长的缺陷.为了克服这两个缺陷,文章提出了一种基于图滤波的快速谱...  相似文献   

15.
区分高频噪声点和边缘点是提取噪声图像边缘的难点之一,为了得到噪声图像的清晰边缘,提出一种基于谱聚类(spectral curvature clustering,SCC)的边缘检测算法.该方法通过将边缘检测问题转化为分类问题,利用图像边缘点、平滑点和噪声点位于不同子空间的性质,在有效地聚类平滑点和边缘点的同时,SCC能够较好地抑制噪声点.另外,该算法通过编辑聚类标签并将其转换为二值图像,对二值化图像进行简单的处理即可得到图像的边缘,成功地避免了传统算法中的阈值选择问题.相比于传统的边缘检测方法,实验结果证明了所提算法的有效性.  相似文献   

16.
k-means和谱聚类是两种应用最广泛的聚类技术.k-means是基于矩阵分解的聚类方法,并且是在数据空间上基于误差极小化的聚类方法.谱聚类是基于图的聚类方法,并且是基于两点在数据空间和特征空间的相似性保持的聚类方法.为了利用两者的优势,提出一种基于乘法更新规则的k-means和谱聚类的联合学习方法,该方法将k-mea...  相似文献   

17.
基于概念分组的Web搜索结果聚类算法   总被引:2,自引:0,他引:2  
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解.  相似文献   

18.
提出一种用拉普拉斯图的谱系数夹角谱特征来描述图像几何结构的方法,同时研究了基于图的谱聚类系统.首先将序列图像以角点的形式构成拉普拉斯矩阵;然后分解该矩阵,结合特征值和其特征向量计算图中各点的谱系数夹角谱特征;再以局部保持投影方法将这些向量内嵌到模式空间,并在其特征空间用模糊c-均值算法进行聚类分析.结果表明,以拉普拉斯图的谱系数夹角谱特征解决了图中各点在向量空间的分布及其对应关系,在模式空间进行的聚类分析是有效的.  相似文献   

19.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.  相似文献   

20.
针对实际应用中经常出现的异类数据源,采用多核学习的支持向量机受到关注.然而随着核函数数量的增多,计算量也随之大大增加.为了解决这一问题,该提出了一种利用协同聚类对多核支持向量机的训练数据进行简化的方法,可以减少支持向量机的数目,从而减少计算量.实验结果显示,提出的方法可以提高多核支持向量机的效率,同时还不会影响分类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号