期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王娜侯爽《河北省科学院学报》2009,26(4):11-13

K-最近邻算法是数据挖掘分类方法中最常用的算法之一.在很多实际问题上都有应用.本文对近年来基于K-最近邻算法的各种改进技术进行了分析.从速度提高和准确度提高两个方面给予了归纳. 相似文献

2.

张红云石阳马垣《辽宁科技大学学报》2001,24(5)

聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户.为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献

3.

数据挖掘中聚类算法比较研究

张红云石阳马垣《鞍山科技大学学报》2001,24(5):364-367,371

聚类算法是数据挖掘中的核心技术 ,虽然聚类算法已被广泛深入的研究 ,但其应用在数据挖掘领域时间不长 ,其间产生了许多不同的适用于数据挖掘的聚类算法 ,但这些算法仅适用于特定的问题及用户 .为了更好的使用这些算法 ,综合提出了评价聚类算法好坏的 5个标准 ,基于这 5个标准 ,对数据挖掘中近几年提出的常用聚类方法作了比较分析 ,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法相似文献

4.

基于关联规则的数据挖掘算法研究

王娟《科技信息》2011,(33):56-56,45

关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。相似文献

5.

动态云模型大规模数据挖掘算法

黄取治《吉林工学院学报》2014,(3)

分析了云计算和数据挖掘的关系,研究了SLIQ和SPRINT两种数据挖掘算法,提供了一种数据存储量不断增加时基于动态云模型的数据挖掘算法。相似文献

6.

基于权重的Jaccard相似度度量的实体识别方法

潘磊雷钰丽王崇骏谢俊元《北京交通大学学报(自然科学版)》2009,33(6)

社会网络分析方法将社会行动者映射为图的节点,社会行动者之间的关系映射为图的边,然后利用图论的相关知识来解决社会网络问题.将数据挖掘方法应用于社会网络分析是数据挖掘研究领域的一个新方向.本文主要在算法改进和系统实现层面展开数据挖掘在社会网络分析中的应用,提出了基于权重的Jaccard相似度度量的方法及处理多链接属性的实体识别算法.最后基于电信分析系统平台,使用上述算法在电信数据集上进行测试,实验结果表明上述算法的有效性和实用性. 相似文献

7.

数据挖掘在安钢电极预测建模中的应用

郭飞李华德冉正云《北京科技大学学报》2008,30(2):202-207

从安钢电极控制的实际应用出发,应用数据挖掘技术建立了电极预测模型并应用于电极控制系统的参数整定.首先介绍了建立电极预测模型的数据挖掘过程;然后在数据挖掘算法中提出了一种新的变结构遗传Elman网络方法,该算法用改进的混合遗传算法对网络结构和权值及自反馈增益同步动态寻优.将基于BP算法的Elman网络和本文提出的变结构遗传Elman网络都应用于安钢交流电弧炉的电极预测模型中进行比较.通过基于安钢现场数据的计算机仿真实验表明:采用变结构遗传Elman网络的数据挖掘算法比BP算法具有更好的动态性能、更快的逼近速度和更高的精度.在此基础上,把建立的模型应用于安钢电极控制系统的参数整定,取得了良好的控制效果. 相似文献

8.

数据挖掘中聚类分析技术方法的比较研究

任春美孔磊《科技信息》2008,(24)

聚类是数据挖掘领域中的一个重要研究课题.聚类在电子商务、图像处理、模式识别、文本分类等领域有广泛的应用.本文首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法. 相似文献

9.

数据挖掘领域中的聚类方法 总被引：4，自引：0，他引：4

王美华《南华大学学报(自然科学版)》2004,18(1):58-62

聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献

10.

基于数据挖掘技术的智能信息处理系统

李敬有邓文新张昕《齐齐哈尔大学学报(自然科学版)》2007,23(3):29-32

着重阐述在数据挖掘阶段提出并改进基于关联规则的Apxioxi并行算法、基于分类的判定树归纳算法和基于聚类的K簇算法，并将几种算法综合应用到智能信息处理过程中。相似文献

11.

基于图的挖掘关联规则改进算法

唐德权《湖南文理学院学报(自然科学版)》2006,18(3):72-74,79

关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优. 相似文献

12.

一种挖掘大型数据库的关联规则新算法

李志云周国祥张丽萍《合肥工业大学学报(自然科学版)》2010,33(2)

关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。相似文献

13.

NPSP:一种高效的序列模式增量挖掘算法 总被引：4，自引：3，他引：1

张兵聂永红林士敏《广西师范大学学报(自然科学版)》2004,22(4):22-26

提出了一种称为“异构树”的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程,在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性．相似文献

14.

基于遗传算法和Best-First图搜索的约减集求解算法

黄欣杨杰叶晨洲《上海交通大学学报》2000,34(7):885-888

提出了两种新的约减算法,分别运用遗传算法和Ｂｅｓｔ－Ｆｉｒｓｔ搜索方法求约减集,前者利用了遗传算法的寻优特性从种群中获得一最优及一组次优个体,进而获得一组约减;后者采用Ｂｅｓｔ－Ｆｉｒｓｔ搜索方法,相对于Ａ算法可扩大搜索空间,并可从ｏｐｅｎ表前部获得一最优及一组次优的状态节点,进而获得一组约减。实验结果表明,文中提出的算法是有效且合理的。相似文献

15.

关联规则Apriori算法的改进 总被引：7，自引：0，他引：7

杨晓平《浙江海洋学院学报(自然科学版)》2006,25(2):176-182,195

Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。相似文献

16.

BP网络计算机优化的实现 总被引：1，自引：1，他引：0

赵雷《山东科技大学学报(自然科学版)》2003,22(2):108-110

反向传播算法(B-P算法)，是数据挖掘算法中最基本的算法之一。面对大量的数据，怎样选择数据结构，怎样优化参数的设置，怎样优化处理过程，对于此算法的性能将会十分重要。本文主要提出了对该算法的若干改进和优化。实验显示，这些改进和优化都能够在整体上提高算法的效率，能够正确、有效、快速地实现B-P算法。相似文献

17.

用于挖掘TCM-FP树中维间最大频繁项集的算法

韩立毛鞠时光朱金伟《江南大学学报(自然科学版)》2010,9(2):185-190

为了提高数据挖掘算法在中医药数据处理中的效率,提出了采用TCMA算法挖掘TCM-FP树中的维间最大频繁项集。根据中医药数据的特点及药组挖掘的需求,在FP-growth算法的基础上,提出了TCM-FP树及其建树算法和挖掘算法TCMA,在TCM-FP树中采用优化搜索策略挖掘维间最大频繁项集,与FP-growth算法挖掘所有频繁项集比,大大缩短了时间。优化搜索算法切合中药TCM规则挖掘的实际意义,比FP-growth算法挖掘有更高的运行效率。相似文献

18.

一种用于数据挖掘算法的数据生成方法 总被引：1，自引：0，他引：1

魏伟杰张斌王波张明卫《东北大学学报(自然科学版)》2008,29(3):328-331

由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程. 相似文献

19.

空间co-location模式挖掘算法介绍及应用

包玉珍王丽珍周丽华《郑州大学学报(理学版)》2007,39(3):84-88

当前挖掘空间co-location模式所遇到的困难在于,空间对象的实例分布在连续的空间中并拥有复杂的空间关系,大部分的计算时间需要用来生成co-location模式的表实例.分析了co-location模式挖掘的实质,以及近年来提出的co-location模式挖掘的全连接算法和无连接算法,并对这两种算法在性能上加以比较.在此基础上,结合三江并流国家基金项目,用这两种算法挖掘出了共生植被及其分布情况,为生物学家的科学研究提供了有利的帮助. 相似文献