首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
一种增量式文本软聚类算法   总被引:1,自引:0,他引:1  
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.  相似文献   

2.
用聚类-分类模式解决聚类问题   总被引:4,自引:2,他引:2  
分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。  相似文献   

3.
已有的大多数聚类算法都假设数据集保持不变,然而,很多应用中数据集是会随时间变化的。为此,提出了一种新的三支决策软增量聚类算法。采用区间集的形式表示类簇,区间集的上界、边界与下界就对应着三支决策产生的正域、边界域和负域,并提出了一种基于代表点的初始聚类算法。采用同样的方式对新增数据集进行一次预聚类,以消除数据处理顺序对最终聚类结果产生的影响。为了快速查找新增数据的相似区域,建立了代表点搜索树,并且给出了查找和更新搜索树的策略。运用三支决策策略完成增量聚类。实验结果表明提出的增量聚类算法是有效的。  相似文献   

4.
介绍了聚类误差平方和准则,指出了误差平方和准则的不足,提出了误差绝对值和准则、最大误差准则以及误差p次方和准则.  相似文献   

5.
基于模糊相似度的科技文献软聚类算法   总被引:3,自引:0,他引:3  
本文提出了一种新的文档软聚类算法。将关键字通过文档的题名、摘要进行映射扩展,并对关键字的出现位置进行加权构造文本向量空间。利用模糊最大支撑树聚类过程中类间和类内相似度变化的规律自动识别最佳聚类数K及硬聚类簇。以硬聚类簇为核心将聚类相似度减小到下相似度进行扩展,从而形成相应软聚类。实验表明该算法能够有效地降低特征维数、提高软聚类精度和速度。  相似文献   

6.
传统软子空间聚类算法在利用局部搜索策略解决等式约束的连续非线性的变量加权问题时,易陷入局部最优导致聚类效果不佳.针对该问题,该文提出了一种随机学习萤火虫算法优化的模糊软子空间聚类算法.该算法利用具有全局搜索能力的萤火虫算法对新算法的目标函数进行优化,同时,为弥补萤火虫算法易提前收敛和寻优精度较低的缺陷,对萤火虫种群进化...  相似文献   

7.
提出了一种通过调整减法聚类半径优选模糊规则的软测量建模方法。首先用减法聚类建立T—S模糊模型,然后通过调整聚类半径优选模糊规则数,以取得具有良好泛化性能的模型,之后利用梯度下降混合最小二乘算法精调参数。最后用该方法对初馏塔石脑油干点进行软测量建模,结果表明能较快确定优化模型,并能满足软测量建模精度要求。  相似文献   

8.
聚类布尔和分类数据   总被引:1,自引:0,他引:1  
提出了一种判别布和分类属性相似度的准则,并在此基础上提出了一种新的聚类的算法CAC,该算克服了传统聚类算法不适合聚类布尔和分类属性数据的缺点,实验表明CAC算法比传统的聚类算法有更好的聚类效果。  相似文献   

9.
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。  相似文献   

10.
基于模糊c均值聚类的多模型软测量建模   总被引:25,自引:2,他引:25  
根据几个模型相加可提高模型的预测精度及鲁棒性的思想,提出了一种非线性软测量建模的新方法。即先用模糊c均值聚类将训练集分成具有不同聚类中心的子集,每一子集用RBF网络或部分最小二乘法进行训练得出子模型,再用模糊聚类后产生的隶属度将各子模型的输出加权求和得到最后结果,此算法通过一个复杂非线性函数的仿真建模和一个分馏塔柴油倾点软测量建模的工业实例研究,结果表明比其它算法具有更好的泛化结果和预报精度,具有  相似文献   

11.
提出一种新的聚类算法——层次谱聚类算法.该算法在传统二分的SM谱聚类的过程中嵌入了层次聚类算法,目的是为了提高谱聚类的聚类正确率,同时又利用谱聚类纠正了层次聚类过程中所得到的歪斜划分.实验结果表明:提出的层次谱聚类算法的聚类正确率比层次聚类算法、谱聚类算法的聚类正确率都要高,同时又纠正了层次聚类过程中的歪斜划分.  相似文献   

12.
针对传统失效模式与影响分析(failure mode and effect analysis,FMEA)的不足,提出了一种基于云模型和凝聚型层次聚类算法的改进FMEA方法。首先,运用云模型对专家评估信息进行描述与集结;然后,结合凝聚型层次聚类算法识别云模型评价信息,利用聚类子簇确定失效模式间关联关系,利用聚类结果确定失效模式风险等级。最后,以在线教学失效风险评估为例,验证了该改进FMEA方法的可行性和有效性。  相似文献   

13.
介绍基于分层聚类法的视频摘要技术,与以往视频摘要技术相比较,这种方法不用选取阚值,可以方便地控制关键帧数量,并对关键帧采用分层显示的方法,使视频摘要简单明了,为用户提供了非线形浏览视频的服务。最后提出一些改进措施。  相似文献   

14.
15.
无线传感器网络中基于能量的分级簇算法   总被引:6,自引:3,他引:6  
针对无线传感器网络中传感器一次性电源供电的特点,提出用极大权中继集的根树模拟虚拟骨干网,构成高效能多级簇树;通过优先选择剩余能量高、与所有邻居交换信息耗能少的传感器节点为簇头的策略和定期更换簇头及移动基站的机制,减小和均衡每个传感器耗能,从而延长全网寿命.仿真结果表明了算法的有效性.  相似文献   

16.
考虑到实验数据的大规模及样本数据形状的复杂性等特点,提出一种基于分级聚类与DBSCAN聚类相结合的HL-DBSCAN聚类算法,避免了DBSCAN的聚类算法较大的时间复杂度,适用性更广,更能体现一个聚簇的规律,提高分类精度.通过实验与结果分析,取得较好的聚类结果,证明了该算法在文本聚类处理中的可行性.  相似文献   

17.
一种基于层次聚类的流数据挖掘方法   总被引:1,自引:0,他引:1  
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法.  相似文献   

18.
提出一种基于图的层次聚类算法实现脑组织磁共振图像的自动分割。首先,采用基于图的分割方法对脑组织MR图像进行初始分割。由于脑组织MR图像各类组织结构分布复杂,尤其是脑脊液和灰质区域细节信息丰富、结构变化多样,分割结果中存在过分割现象。因此,利用对偶树复小波变换高频子带信息构造基于图的分割方法中参数k的自适应取值函数,避免图像平滑区域分割后产生大量小区域。然后,以层次聚类算法合并分割得到的小区域,解决基于图的方法分割脑组织MR图像中存在的过分割问题。最后,通过大量真实脑组织MR图像实验证明该方法在脑组织MR图像分割中的准确性和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号