首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于聚类矩阵的CM-Apriori算法研究   总被引:1,自引:0,他引:1  
针对关联规则中Apriori算法的不足,提出了一种基于聚类矩阵的CM-Apriori新算法.该算法只需扫描事务数据库一次,就直接按事务项数生成聚类矩阵,每次只需对部分聚类矩阵进行运算,就可以生成频繁项集.这大大减少了扫描数据库的次数和计算成本,从而有效提高了算法的运算效率,并通过实例说明了它是一种有效的关联规则挖掘方法.  相似文献   

2.
聚类分析是重要的数据挖掘方法,在商务智能、地理信息系统、医学等方面有广泛的应用.随着聚类分析的蓬勃发展,涌现出了许多聚类算法,其中最重要的算法之一是基于密度的空间聚类以及其多种变种——基于密度连通链、基于加权密度、基于引力连通集合的算法.这些算法在概念上相似但没有统一的描述.本文针对基于密度的空间聚类及其变种提出了拓扑的概念.给出了聚类拓扑结构的定义,把簇定义为拓扑连通集合.此外,本文运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法.实例证明此算法有效.  相似文献   

3.
基于矩阵分解和聚类提出一种协同过滤推荐算法. 先利用交替最小二乘(ALS)算法进行矩阵分解, 再利用改进的k-均值聚类算法弥补单一ALS算法在后期协同过滤阶段产生的大计算量问题, 解决了由于减小原始矩阵高维度、 高稀疏性带来的推荐准确度较低的问题, 极大提高了计算速度和推荐精度. 实验结果表明, 改进算法在推荐准确性上有明显提高.  相似文献   

4.
一种基于矩阵变换的层次聚类算法   总被引:1,自引:0,他引:1  
针对K-means算法需预先确定聚类数的缺陷,提出一种基于矩阵变换的层次聚类(NHC)算法,通过对矩阵行列的排序、变换,把矩阵分块成子矩阵聚类,以熵作为评价聚类结果标准.实验表明,NHC算法的执行效率和聚类精度高于传统的HCM(hard C-means)算法.  相似文献   

5.
李顺勇  余曼  王改变 《河南科学》2020,38(10):1549-1557
为了对含有多个特征向量的分类矩阵对象数据进行描述,提出了一种新的基于簇间信息的分类矩阵对象数据的聚类算法(between-cluster k-modes,简称BC-k-modes).该算法利用k-modes算法的聚类过程,对分类矩阵对象数据进行聚类,导出隶属度矩阵与聚类原型的更新公式,通过增加簇间信息对目标函数寻求局部最优解.最后在五个真实数据集上进行了实验,结果表明该算法对真实数据的聚类效果明显优于其他算法.  相似文献   

6.
文章提出一种新的用户浏览模式的聚类算法,该算法应用马尔可夫链与模糊逻辑理论,通过对Web会话文件的处理,赋予类标记,实现了根据访问模式对用户的分类,以便个性化推荐和指导不同类别的用户进行学习.  相似文献   

7.
面对大量繁杂的新闻数据,为了让人们从大量的数据中了解主要类别信息,将采集到的11456条校园综合新闻作为研究对象,采用了基于词云和top3文章主题的k-means聚类方法.通过词频-反文档频率技术将采集到的11456条校园综合新闻进行主题提取,并用词云结果来估计k值,结果可将采集到的校园综合新闻数据聚为7个类别,与不基...  相似文献   

8.
图像聚类是当前的研究热点,非负矩阵分解(non-negative matrix factorization, NMF)算法在图像聚类领域得到了广泛应用。但是单一的NMF算法无法应用于所有数据集,并且NMF算法直接在数据的原始空间进行处理,抗噪能力较差。集成聚类可以解决上述问题,集成聚类将若干个基础聚类结果合成一个一致性结果,不仅可以提高聚类的求解质量,还可以增强算法的鲁棒性。因此本文提出一种层次预处理的NMF加权集成聚类算法。该算法将层次划分、集成聚类和二部图的思想引入到NMF算法中。在预处理阶段,利用层次划分得到聚类数目。之后采用局部加权的方法得到协关联矩阵。最后利用基于二部图的一致性函数进行划分得到最终的聚类结果。在5个数据集上进行实验,验证了本文算法相对于传统算法和其他集成算法的有效性。  相似文献   

9.
通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了一定的改进.  相似文献   

10.
为了弥补K-Means算法对孤立点数据敏感的缺陷,提高K-Means算法对包含孤立点数据集的聚类效果,在深入研究K-Means算法的基础上,提出了基于PAM和簇阈值的改进K-Means聚类算法。该算法首先对待聚类数据进行抽样,然后利用PAM算法获取样本数据的聚类中心,以样本数据的聚类中心作为KMeans算法的初始聚类中心。在聚类迭代过程中动态计算各簇阈值,利用簇阈值准确地过滤孤立点数据。实验结果表明,本文提出的算法不仅聚类时间短,而且具有较高的聚类准确率。  相似文献   

11.
文章首先定义一种新的直觉模糊集之间的关联系数,利用此关联系数给出关联矩阵;其次,通过平方法把关联矩阵转化为等价关联矩阵,形成聚类原则,得出聚类算法;最后,通过实例对算法进行验证.  相似文献   

12.
文章首先定义一种新的直觉模糊集之间的关联系数,利用此关联系数给出关联矩阵;其次,通过平方法把关联矩阵转化为等价关联矩阵,形成聚类原则,得出聚类算法;最后,通过实例对算法进行验证.  相似文献   

13.
基于APSO的模糊聚类算法   总被引:1,自引:0,他引:1  
利用改进的自适应粒子群优化算法(APSO)较强全局寻优、快速收敛的特点和模糊C-均值算法(FCM)对初始值敏感、容易陷入局部最优的缺点.提出一种基于自适应粒子群优化算法的模糊聚类算法(APFM).新算法有效的克服了FCM算法的缺点,同时增强了APSO算法全局搜索和跳出局部最优的能力.实验表明:新算法与单一的FCM和APSO算法相比聚类更准确,效率更高.  相似文献   

14.
利用改进的自适应粒子群优化算法(APSO)较强全局寻优、快速收敛的特点和模糊C-均值算法(FCM)对初始值敏感、容易陷入局部最优的缺点,提出一种基于自适应粒子群优化算法的模糊聚类算法(APFM)。新算法有效的克服了FCM算法的缺点,同时增强了APSO算法全局搜索和跳出局部最优的能力。实验表明:新算法与单一的FCM和APSO算法相比聚类更准确,效率更高。  相似文献   

15.
在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。  相似文献   

16.
一种新的基于蚁群原理的聚类算法   总被引:1,自引:1,他引:0  
为了改善聚类分析的质量,提出一种与蚁群原理相结合的聚类方法. 首先对传统的聚类算法k-means进行改进,克服传统的k-means算法必须事先确定分类的个数k和选择聚类点的缺陷,然后将蚁群算法的转移概率引入k-means算法,对上述聚类结果进行二次优化.实验结果表明,改进的k-means与蚁群算法相结合的聚类方法比单一聚类算法更有效.  相似文献   

17.
一种基于相似性的文档聚类算法   总被引:2,自引:0,他引:2  
针对常见信息检索技术的缺陷,提出一种基于相似性的文档聚类分析算法,将文档集合转化为向量集合,基于向量之间的余弦相似度,采取凝聚的层次聚类算法来获得聚类,给出了算法的详细描述的一个测试实例。  相似文献   

18.
基于链接聚类的Shark-Search算法   总被引:1,自引:0,他引:1  
根据对Shark-Search主题爬取算法的分析,提出了一种基于链接聚类的改进Shark-Search算法. 并通过几个对比实验对该算法进行了验证. 实验结果表明,新算法能够更有效地识别链接与主题的相关性.  相似文献   

19.
研究在样本子集中实现EM估计的递增EM算法.通过检测子样本的似然判断条件,自动选择样本递增的数量,建立子样本的拟合分布逐步逼进完全样本的高斯模型的过程,改进了传统EM算法在每一步迭代都需要遍历完全样本的计算复杂性以及效率较低的问题.实验结果表明,与EM算法相比,该算法能更早地达到估计值的领域,具有较快的收敛速度,聚类效...  相似文献   

20.
将进化规划算法应用于图像聚类问题,对问题的解进行符号编码,采用群体智能模式实现问题解的搜索.利用进化规划算法的变异算子和选择算子可以有效提高算法的全局搜索能力,采用高斯变异算子保证了优秀解的多样性,降低了进化操作的复杂性.仿真实验证明基于进化规划算法的图像聚类算法具有可行性和准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号