首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
文中提出了一种改进的知识发现算法. 针对基于留数分析和递归切割的模式发现算法的不足,在样本空间分割时,考虑到不同属性对知识发现的不同贡献,采取不同的离散化标准;在模式判别准则方面,改良后的算法随切割后产生的子空间数量动态调整模式判别准则. 在人造数据集和电力系统安全稳定评估中的应用结果验证了算法改进思路的合理性与有效性. 与原算法相比,改良后算法的知识发现效率更高、应用范围更广.  相似文献   

2.
从数据库中发现知识的研究   总被引:1,自引:0,他引:1  
赛煜  姚红  李林 《山东科学》2004,17(4):57-59
数据库知识发现是90年代中期兴起的决策支持新技术,是人工智能、机器学习与数据库技术相结合的产物。要从数据量庞大的大型数据库中发现知识,就不得不考虑学习算法的效率。将粗集理论应用到数据库知识发现中,可以从数据中自动抽取与给定的学习任务相关的属性,能有效地发现简练、贴切的知识。本文探讨了这一应用的理论基础和实现算法。  相似文献   

3.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

4.
粗糙集理论及其应用进展   总被引:90,自引:0,他引:90  
粗糙集理论是一种新型的处理模糊和不确定知识的数学工具。目前已在人工智能、知识与数据发现、模式识别与分类、故障检测等方面得到了广泛应用。首先描述了粗糙集的基本算法及其复杂度 ,包括等价关系 ,上下近似及各种约简算法 ;接着对粗糙集扩展理论 ,如可变精度模型 ,相似模型等进行了讨论 ,然后对粗糙集在数据挖掘、大数据集、粗糙逻辑、多方法融合等领域中的应用进展情况进行了论述 ,最后给出了建议的研究方向  相似文献   

5.
为了更好地为广大学者阅读文献提供个性化的推荐服务,针对中国知网学术论文发现科研社区,提出了一种科研社区发现算法:首先利用Pajek构建出科研论文合著网络,并将网络公共数据集Dining-table partners和Sampson作为测试数据集,对科研社区发现算法和社区发现经典算法GN算法进行性能对比分析,验证科研社区发现算法的性能更优;最后利用算法发现科研社区结构,实验结果表明社区划分的效果较好。  相似文献   

6.
为了有效辨识电力系统暂态失稳后发电机的动态行为,以失稳后的功角数据为输入特征信息,提出一种基于知识发现和分层极限学习机(ELM)的失稳模式辨识方法。首先利用ELM快速辨识系统暂态不稳定的功角样本。为了充分利用不稳定样本自身结构来挖掘关键信息,引入知识发现算法KODAMA以获取发电机的不稳定动态行为模式,构建失稳功角模态集。然后,根据所得模态数据集,为提高不稳定模式辨识的准确性,设计了分层ELM的辨识策略以辨识发电机的失稳模式。最后,在Nordic系统中验证所提方法的有效性,测试结果表明提出的辨识方法能够准确地辨识失稳模式,且在保证尽可能高精度的前提下,具有相对快速的评估速度。  相似文献   

7.
针对数据挖掘中的文本分类问题,提出了一种基于遗传算法和信息熵的文本分类规则抽取算法Genet-ic-Miner(简称GM),该算法的目标是在数据集中发现分类规则。首先利用信息熵生成初始种群,然后利用优化的遗传算法抽取相应规则。采用六个标准的公共领域的数据集比较了GM与其它两个非常著名的同类算法Ant-Miner和CN2,实验结果表明,无论是预测准确性和规则的简单性,GM都明显优于Ant-Miner和CN2,并且该算法能大大提高对知识的理解力。  相似文献   

8.
针对原始数据库中增加数据时如何更新规则的问题,提出并应用了一种基于权值的序列模式更新算法UW IUA。该算法利用权值来归约子序列集和利用知识数据库中保留的最小非大序列集产生新的候选序列集,避免了重复遍历原始信息库而造成数据量太大的问题,从而缩短程序运行时间和节约数据存储空间,较好地改进了算法性能。实验结果证明UW IUA算法的效率高于IUA算法。  相似文献   

9.
基于粗糙集方法的知识发现   总被引:1,自引:0,他引:1  
属性约简和属性值约简是租糙集理论中的重要研究内容,也是粗糙集理论应用于知识发现的主要方法.但求取任意问题的最小属性集是一个NP难问题.本文利用属性间的知识依赖度,提出了一个求取属性约简的贪心算法,它可以在多项式时间内得到一个约简.同时,把粗糙集方法应用于知识发现,通过属性约简删除信息系统的冗余属性,减少数据量,再利用属性值约简,获取决策规则.最后通过实例说明了基于粗糙集方法的知识发现过程,验证了方法的有效性.  相似文献   

10.
频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点,传统Apriori及其改进算法,要多遍扫描数据库并产生大量的候选项目集,针对Apriori算法的缺陷,Han JW(韩家炜)提出FP-growth算法,该算法仅须扫描数据库两遍且无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了频繁项目集的挖掘效率,但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项目集,因而影响了频繁项目集的挖掘效率,为此,在引入F-矩阵概念之后,提出了FP-growth的一种改进算法—IFP-growth,并对改进算法的性能进行了测试,实验结果表明,IFP-growth算法优于FP-growth。  相似文献   

11.
A novel DNA coding based knowledge discovery algorithm was proposed, an example which verified its validity was given. It is proved that this algorithm can discover new simplified rules from the original rule set efficiently.  相似文献   

12.
 模式分类过程涉及到对原始训练样本的学习,容易导致用户隐私的泄露。为了避免模式分类过程中的隐私泄露,同时又不影响模式分类算法的性能,提出一种基于主成分分析(PCA)的模式分类隐私保护算法。该算法利用PCA 提取原始训练数据的主成分,并将原始训练样本集合转化为主成分的新样本集合,然后利用新样本集合进行分类学习。选用Adult 数据集和KDDCUP 99 数据集进行仿真实验,并采用正确率和召回率进行性能评价,结果表明,该隐私保护算法通过PCA 提取原始数据特征属性的主成分,可避免原始属性的泄露,同时PCA 在一定程度上可实现去噪,从而使分类器的分类性能优于原始数据集的分类性能。与已有算法比较,该隐私保护算法具有更好的模式分类精度和隐私保护性能。  相似文献   

13.
动态迭代聚类算法分析基因序列数据   总被引:1,自引:0,他引:1  
聚类技术在知识发现方面发挥了很重要的作用,K—均值算法是聚类分析中最常用的算法,但K—均值算法必须预先选择类的数目作为先验值,即研究者需要确定数据空间内有意义类的数目.针对这个问题,本文提出一种新的聚类算法—动态迭代聚类算法,动态选取K个边缘相似度的数据对象作为最初的初始聚类点,并根据类内或类间的相似度离差程度不断地精练(合并或分割)初始类群.模拟实验结果表明,该算法提高了聚类质量,使聚类具有更高的准确性。  相似文献   

14.
针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSC-SN(text soft classifying based on similarity threshold and non-overlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSC-SN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类.  相似文献   

15.
一种序列模式的概念及挖掘算法   总被引:1,自引:1,他引:0  
介绍了一种时间序列模式的形式和概念,讨论了其相关的挖掘算法.将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析.挖掘算法由以下几部分构成建立频繁物品集,进行数据处理和转换,并生成候选子序列,通过验证后,得到长度为2,3,…的序列集合,从中选出独立最大序列即为所求.通过实例指出了该算法和传统的Aprioriall算法的不同之处.结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景.  相似文献   

16.
粗集在知识发现中的应用   总被引:4,自引:0,他引:4  
粗集作为一种数据分析理论,能有效地从不确定性的数据中发现知识,是目前在知识发现领域研究的热点之一。首先对粗集理论做了简单介绍,在此基础上论述了粗集作为一种数学工具在知识发现领域中的重要问题,并提出粗集的进一步可能发展方向。  相似文献   

17.
提出了两种新的约减算法,分别运用遗传算法和Best-First搜索方法求约减集,前者利用了遗传算法的寻优特性从种群中获得一最优及一组次优个体,进而获得一组约减;后者采用Best-First搜索方法,相对于A算法可扩大搜索空间,并可从open表前部获得一最优及一组次优的状态节点,进而获得一组约减。实验结果表明,文中提出的算法是有效且合理的。  相似文献   

18.
重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域.传统的单机运算架构已经难以满足各类大规模复杂网络的分析和计算要求.人工智能领域的研究人员提出将社区发现应用到网络...  相似文献   

19.
数值仿真结果中知识发现的模糊-粗糙集方法   总被引:3,自引:0,他引:3  
分析了塑性成形过程数值仿真结果的特点和采用离散化作为粗糙集数据预处理方法的不足,提出用模糊-粗糙集算法对仿真结果进行数据挖掘,并以NUMISHEET’93中盒形件拉伸为例进行了数值仿真,从中提炼出对加工工艺和模具设计有指导意义的产生式规则,且每条规则都有可靠性度量,有利于知识推理中的规则调度.研究结果表明,该算法是一种适用于本领域特点的更有效的算法.  相似文献   

20.
提出了一种利用ICMP和SNMP协议特性结合的网络拓扑发现算法 ,采用主动探测与被动监视的技术 ,并对该技术涉及的协议理论进行了分析 .给出了程序功能模块定义、数据结构设计与程序实现步骤 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号