首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
浅谈数据挖掘技术及数据挖掘方法   总被引:1,自引:0,他引:1  
魏焕新 《科技信息》2009,(32):246-246,249
数据挖掘是人们长期对数据库技术进行研究和开发的结果,是当前计算机科学研究的活跃领域。数据挖掘技术能快速有效地从海量的网络信息中,挖掘出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。数据挖掘方法结合了数据库技术、机器学、统计学等领域的知识,从深层次挖掘有效的模式。数据挖掘技术具有广泛的应用前景。  相似文献   

2.
结合人工神经网络中的自适应共振理论(ART)及数据挖掘(Data Mining)技术来建构一个可自动聚类族群特征且能挖掘出关联特质的自动化在线推荐系统。探讨如何有效地运用数据挖掘技术从大量的数据库中挖掘出完整知识,以推荐适当的信息给使用者,帮助他们在浩大的信息流中找到真正需要、有用的文件或信息。整合ART及数据挖掘技术,并针对推荐系统的特性提出一种改进的ART算法(MART算法)。实例验证了算法的有效性。  相似文献   

3.
更新挖掘最大频繁项目集是多种数据挖掘应用中的重要问题,其发现过程的高花费要求对高效更新挖掘算法进行研究.提出了一种快速的更新挖掘最大频繁项目集算法,其能够在原有挖掘结果的基础上,有效地挖掘出更新后的数据库中隐含的新最大频繁项目集.  相似文献   

4.
间接关联是数据挖掘领域中一种数据项之间的关联关系,可有效地应用于市场营销及Web日志分析等领域.现有的间接关联挖掘算法采用Apriori算法框架,需挖掘出所有的频繁项目集,因而存在挖掘效率低的缺陷.为此,提出了一种基于前缀广义表的快速间接关联挖掘算法,该算法无须生成所有的频繁项目集且仅须扫描数据库2遍,可有效提高间接关联的挖掘效率.  相似文献   

5.
关联规则在股票分析中的应用   总被引:6,自引:0,他引:6  
本文介绍了在数据挖掘中关联规则的基本概念和属性 ,进一步讨论了关联规则在股票信息数据挖掘中的应用 .股票的行情交易数据库在经过一定的预处理后 ,用Aprorio算法挖掘出隐藏在数据背后的有用的规则 ,为投资者提供了有效的决策支持 .  相似文献   

6.
基于序列数据挖掘的中文网页特征选择方法   总被引:1,自引:0,他引:1  
提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型. 该方法运用改进的PAT树结构挖掘频繁出现在同一类中文网页中的字符串,通过净频率计算,挖掘出中文网页中频繁出现的有意义的词、短语、英文单词等,并结合CHI算法得到文本特征. 实验表明,该算法不仅能挖掘出传统方法所选择出的绝大部分特征,还能挖掘出一些有意义的、切词系统词库中没有的、能反映分类特点的人名,地名,新词、常用语、外文单词等.  相似文献   

7.
关联规则挖掘中的关联推理   总被引:1,自引:0,他引:1  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的.现基于覆盖运算,讨论已知关联规则可导出其它关联规则,并指出存在能覆盖全部关联规则的最小规则集.  相似文献   

8.
数据分类是数据挖掘中的一个重要课题,研究各种高效的分类算法是数据挖掘的重要问题之一.本文对了GAAA算法进行改进提出了一种新组合优化算法,将其应用到分类规则的优化问题,采用遗传算法生成信息素分布,利用蚂蚁算法求精确解,优势互补,有效地节省了计算时间,并优化了生成的分类规则.实验结果表明:该算法可以有效克服停滞,提高搜索效率,有效地挖掘出最优的分类规则集.  相似文献   

9.
研究如何将BP神经网络与数据挖掘技术相结合,从海量数据中挖掘出潜在的有用的信息.介绍了数据挖掘以及神经网络的概念,分析了数据挖掘技术的处理过程以及BP神经网络的原理,阐述了数据挖掘技术与神经网络结合的关键技术及实现方法.  相似文献   

10.
文章在分析前人算法不足的基础上,提出了一种改进的挖掘多数据库中例外模式和高选票模式的算法,算法分析结果表明改进的算法能更加准确有效地在多数据库中挖掘出潜在的例外模式和高选票模式.  相似文献   

11.
利用决策树发掘分类规则的算法研究   总被引:15,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

12.
要从数据量庞大的大型数据库中发现知识,就不得不考虑学习算法的效率。将粗集理论应用到数据挖掘中,实现了从数据库中自动抽取与给定的学习任务相关的属性,能有效地发现简练、贴切的知识,并给出了这一应用的理论基础和实现算法。  相似文献   

13.
Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by "pruning and laying back" to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision.  相似文献   

14.
基于遗传算法和粗糙集理论的增量式规则获取方法   总被引:1,自引:0,他引:1  
规则获取的增量式算法是数据挖掘领域的一个热点问题.基于粗糙集理论,从规则获取和优化两方面研究了基于遗传算法的增量式规则挖掘方法,它具有结构简单、搜索效率高、求解速度快等优点.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识,并且将遗传算法和规则挖掘算法相结合,建立了新的优化方法,提出了一种基于遗传算法的增量式规则挖掘的方法.在原有规则集的基础上进行规则和规则参数的增量式更新,避免了为更新规则而重新运行规则获取算法.试验结果表明,执行增量式GA的能够有效地获取最优规则.  相似文献   

15.
粗糙集-BP神经网络组合方法及其应用   总被引:1,自引:0,他引:1  
将神经网络与数据挖掘的知识相结合,提出粗糙集-BP神经网络组合方法,并将其应用于围岩稳定性判别。首先,基于山东兖州矿区煤巷信息数据库,建立回采巷道围岩稳定性知识表达系统,对数据进行离散化处理;其次,针对传统BP神经网络收敛速度慢、容错性差、结果不唯一的缺点,采用MATLAB软件开发的粗糙集数据分析程序,对生成的决策表进行挖掘分析,通过挖掘的决策知识引导训练样本的选取和神经网络的建立;最后,在煤巷围岩稳定性判别中予以应用。研究结果表明:BP神经网络克服了传统BP神经网络的缺点,具有容错性好、训练速度快、全局逼近性好、精度高等优点,此方法能较好地用于解决巷道围岩稳定性判别问题。  相似文献   

16.
基于决策树的知识表示模型及其应用   总被引:3,自引:2,他引:1       下载免费PDF全文
针对数据挖掘过程中的数据库精炼问题,在分析现行属性约简方法的特点和不足的基础上,结合决策树算法操作简单、分类速度快的特点,通过知识的规则化描述以及规则族之间的相似性比较,建立了一种基于决策树的属性约简方法(简记为BD-RED),讨论了规则族之间的相似性度量的可释化构建问题,给出了BD-RED的具体实施策略,并结合实例分析了BD-RED的性能。结果表明,BD-RED具有良好的结构特征和较强的可操作性,可以有效实现不同决策理念下的属性约简,适合不同类型的大规模数据库的属性约简。  相似文献   

17.
数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术.研究数据挖掘中的决策树算法以及决策树算法在具体的客户关系管理系统中的研究与分析,对数据挖掘中的决策树技术做了详细的描述.  相似文献   

18.
分析了数据挖掘的工作流程 ,利用数据挖掘从大规模数据库中寻找各变量之间函数依赖近似的强关联和确定条件概率 ,并将该方法应用于数据库决策系统中  相似文献   

19.
通过介绍关联规则的基本概念、意义和作用,并将关联规则挖掘应用到教学评价中,揭示数据中存在的相互关系,得到一些对提高教学质量或水平有用的信息,为学校的教学管理和决策提供参考.  相似文献   

20.
基于数据仓库和数据挖掘的高校决策支持系统的探索   总被引:6,自引:1,他引:6  
在论述的数据仓库、数据挖掘和决策支持系统的基本概念及其关键技术和系统设计方法的基础上,提出了基于数据仓库和数据挖掘的决策支持系统的解决方案.在新方案中将数据库、模型库、方法库有机结合在一起,使系统的高度集成,DSS真正实现从模型驱动到数据驱动的转变.根据当前高校的实际需求,将其在高校管理应用中进行探索,然后重点分析了系统设计在人事管理中典型应用,通过该系统为高校决策提供了科学的依据,指导发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号