首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
距离机制是K近邻算法的关键部分,传统的方法是采用欧式距离来讨论各个属性取值的差异,而对于同一属性取值的差异就显得很简单.采用可拓学来定量描述事物属性的关联函数的性质,构造可拓距离应用到K近邻算法中,设计出可拓K近邻算法.为了验证算法的可行性和准确率,分别应用到二维数据的故障诊断和标准数据集的聚类分析中,实验证明该算法是可行和有效的.  相似文献   

2.
传统变压器异常状态检测算法的有效性与精度仍然有待进一步研究。文章提出了采用投影滑动窗口和可拓K-means聚类相结合的变压器状态异常检测一般模型及分析方法。将空间状态变量投影到坐标轴加以考虑,在可拓距离度量下构造指标关联函数,按照给定的规则建立异常检测模型。以湖州某变电站各项历史监测数据对上述模型进行算例分析,结果表明,该方法可定量分析在线监测数据与变压器异常状态之间的动态关系,为实施变压器状态异常检测提供了一定的理论依据。  相似文献   

3.
基于可拓理论的供应商选择   总被引:2,自引:0,他引:2  
结合供应链环境下供应商选择的实际需要,利用物元模型和可拓集合理论,建立了能够反映供应商选择内在规律的关联函数和可拓评判模型,并通过实例验证了模型的有效性。  相似文献   

4.
可拓学与可拓决策   总被引:3,自引:0,他引:3  
讨论了可拓学与可拓决策产生的实际背景,可拓集合与经典集合、模糊集合之间的区别和联系.研究了可拓集合的特点及其可拓决策应用的前景.  相似文献   

5.
BBS作为信息交流的重要载体,包含了海量的各方面的信息,如何从中快速的寻找到有用的信息是一个亟待解决的问题.提出一种基于动态文本聚类方法的BBS浏览机制,并给出具体的实现方案,从实验结果可见,分类效率和效果均良好.  相似文献   

6.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。  相似文献   

7.
随着互联网中信息的日益增长,通过文本挖掘,快速、准确地检索信息和分类信息成为人们日益迫切的要求,具有广泛的应用前景和实用价值.依据信息论的思想,从文档信息量变化的角度,对文本数据从概率角度来研究文本数据的聚类分析,研究信息量在层次聚类过程中所呈现的规律性,进而提出一种基于信息量模型的聚类分析算法.  相似文献   

8.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

9.
基于有序聚类的文本结构分析方法   总被引:1,自引:0,他引:1  
讨论了基于关系图的文本结构分析方法,鉴于文章组织的有序性,运用有序聚类的思想建立数学模型,并利用最优K分法构造自动文本结构分析算法,以划分文章意义段.实验结果表明,该文本结构分析方法是有效的.将该方法运用于自动文摘技术,可使文摘获得更好的可读性和完整性.  相似文献   

10.
本文首先介绍文本挖掘的定义及一般处理过程,重点探讨了文本分类与分类聚类等文本挖掘的关健技术。  相似文献   

11.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。  相似文献   

12.
 基于关联语义链网络提出了一种自适应分裂的文本聚类方法. 该方法通过从关联语义链网络中检测出各个社团结构作为文本集中的类别, 以避免对聚类数目的预先确定. 同时, 针对高维稀疏的词向量导致的文本之间或文本与类之间相似性低的问题, 将关联语义链网络中词与词之间的关联关系映射到文本与类之间的关联关系中去, 以增强文本与类之间关系的强度. 通过与其他主要聚类方法进行实验对比, 发现该聚类方法不仅能够对文本集合进行准确的聚类, 而且能够较准确地确定聚类中心数目和识别出文本集中的话题信息.  相似文献   

13.
可拓策划是从处理矛盾问题的角度,应用可拓学的方法而进行的策划。文章简介了可拓策划的基本思想、理论和方法,试图用形式化的方法告诉人们,在遇到矛盾问题时,如何生成策划创意,如何进行全面的资源分析、寻找可拓资源,以化不相容为相容,化对立为共存。在可拓策划的实务操作部分,介绍了资源整合的可拓策划、项目的可拓策划、市场开拓的可拓策划及危机防范与处理的可拓策划。  相似文献   

14.
为了准确、有效地获取潜在的用户需求信息,文章提出了一种基于可拓数据挖掘的关联规则挖掘方法,通过将用户需求按不同需求分类,构成具有不同功能属性的用户需求集;利用粒子群算法挖掘出用户需求集中的关联规则,结合可拓变换原理,推理出新的关联规则知识,通过实例验证了方法的有效性和可行性.  相似文献   

15.
随着智能终端的普及,文本的主题挖掘需求也越来越广泛,主题建模是文本主题挖掘的核心,LDA生成模型是基于贝叶斯框架的概率模型,它以语义关联为基础,很好地解决了文本潜在主题的提取问题。对文本聚类过程的核心技术LDA生成模型、数据采样、模型评价等作了较为深入的阐述和解析,结合网络教育平台的2 794篇学习刊物进行了主题发现和聚类实验,建立了包含3 800个词项的词库,通过kmeans算法和合并向量算法(UVM)分两步解决了主题聚类问题。提出了文本挖掘实验的一般方法,并对层次聚类中文本距离的算法提出了改进。实验结果表明,该平台刊物的主题整体相似度比较好,但主题过于集中使得许多刊物的内容不具有辨识度,影响用户对主题的定位。  相似文献   

16.
针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简。实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性。  相似文献   

17.
规范了可拓信息与可拓知识基本概念,即在信息和知识的概念上扩充了变化的信息和变化的知识。明确了可拓数据挖掘概念以及可拓推理新概念。证明了可拓数据挖掘两个定理和可拓推理公式。提出的从挖掘静态知识的数据挖掘扩展到挖掘变化知识的可拓数据挖掘,为数据挖掘开辟了新的研究方向,并通过实例进行了说明  相似文献   

18.
基于灰色可拓物元模型的企业技术创新风险度量研究   总被引:2,自引:0,他引:2  
技术创新是提高企业竞争力,促进企业持续发展的主要途径。然而,技术创新是一项高风险活动,要避免和减少损失,将威胁转化为机会,企业就必须对技术创新风险进行管理,而准确度量风险则是进行技术创新风险管理的基础。将灰色系统理论和可拓物元理论相结合,建立了基于灰色可拓物元理论的技术创新风险度量模型,并将该模型用于企业对技术创新项目进行风险度量和决策。  相似文献   

19.
文本挖掘中的特征表示及聚类方法   总被引:1,自引:0,他引:1  
文本挖掘中特征表示函数的选择影响到特征词表达文本的能力 ,文中设计的评判函数可以比较准确地表达特征词的重要程度。采用K邻近算法对文本集进行聚类 ,产生了较好的聚类效果  相似文献   

20.
简要介绍近年可拓学研究在基础理论方面的新进展,包括可拓学的框架、基元理论、可拓集合理论和可拓逻辑等所取得的成果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号