首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
GPU加速数据挖掘算法的研究   总被引:1,自引:0,他引:1  
分析了GPU的主要架构,在与CPU编程进行对比的同时,基于nVidia的CUDA(compute unified device ar-chitecture),改进了数据挖掘中常用的朴素贝叶斯算法,实现了GPU硬件加速.测试表明,在处理海量浮点数据的分类与排序中,利用图形处理器强大的计算能力获得了较高的实时性.改进算法易于理解和操作,对于GPU在数据挖掘领域的应用具有一定的借鉴意义.  相似文献   

2.
基于文本数据挖掘的硕士论文分类技术   总被引:1,自引:0,他引:1  
针对硕士论文的摘要和关键词等数据进行数据挖掘,实现硕士论文自动分类。为此收集了2 000余个相关数据,在对所研究的数据对象特点进行分析的基础上,确定了分类算法,详细分析了支持向量机分类方法;对收集的研究数据进行了仿真实验,并与其他常用分类器进行比较。实验表明,基于支持向量机的分类方法比其他常用分类器具有较高的准确率。对实验结果中得到的知识进行了分析,得出一系列可供科学研究者和管理者参考的结论。  相似文献   

3.
基于遗传编程(GP)提出一种最优规则遗传算法(BRGA)对分类规则进行优化的方法,获取最佳分类规则集,此算法可以调整分类器模型的相关参数,在适当增加迭代基础上大幅提高分类的精确度,具有相当的灵活性和可理解性.利用6个基因数据集检验了算法的性能.仿真结果表明,本文提出的算法与其他文献的方法相比,在具有较高分类精确度和稳定性前提下大幅降低了计算复杂度及冗余.  相似文献   

4.
以大丰市沿海滩涂湿地区域为研究区,以机载高光谱影像为主要数据源,冠层高度模型(canopy height model,CHM)数据为辅助数据,采用数据挖掘的方法对高光谱数据进行特征规则提取,实现了湿地植被的精细分类.结果表明:3种湿地植被分类结果的总体精度为90.3%,说明数据挖掘技术在处理高维数据时不仅可以提取重要程度较高的数据,而且可以减少数据量,提高数据处理效率与分类精度;与传统的支持向量机分类法(SVM)分类结果进行对比,基于数据挖掘的湿地植被精细分类总体精度比SVM分类方法高10.8%,表明数据挖掘方法在湿地植被高光谱遥感分类问题上具有较大优势.  相似文献   

5.
基于数据挖掘的网络型误用入侵检测系统研究   总被引:5,自引:1,他引:4  
数据挖掘技术应用于网络型误用入侵检测系统中,比传统的网络型入侵检测有更大优势。数据挖 掘是从大量数据中自动寻找规律的过程,它可以自动构建特征,同时提高了检测精确度,为检测未知攻击 提供了可能性。介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了 数据挖掘方法在入侵检测系统中的应用,并且从网络层和应用层2个层次得到实现。  相似文献   

6.
数据分类是数据挖掘的主要内容之一,通过分析训练数据样本,产生关于类别的精确描述.贝叶斯分类是数据挖掘领域中一种常用的有效分类方法.在关系学习中,贝叶斯分类算法有很多种,对这些算法进行总结、比较,指出其优点与不足,对提高分类效率有很大帮助.本文对已有的关系学习中贝叶斯分类算法作了详细的比较,并进行归纳总结.在单关系学习中重点介绍了几种基于粗糙集的贝叶斯分类器和加权贝叶斯分类算法,并分析了各种方法的模型、权值确定方法、优缺点及进一步工作方向.在多关系学习中主要比较了几种基于语义关系图的贝叶斯分类算法,重点介绍了MI-MRNBC模型.最后对本文工作进行了总结与展望,提出进一步工作方向是研究基于粗糙集的多关系贝叶斯分类算法.  相似文献   

7.
林珠  李海威  邢建萍  陈树敏 《广东科技》2012,21(15):212-213
数据归约作为一种数据挖掘中常采用的数据前处理技术,能够有效地提高数据分类的效果,对于时间序列数据,时间维度归约是时序数据挖掘最常用的数据归约技术。以单变量时间序列作为研究对象,提出并实现了一种基于聚类的时间维度归约方法。通过实验表明,该方法能够有效地减少数据维度,有效压缩数据并提高数据挖掘的分类准确率。  相似文献   

8.
决策树分类方法是实现数据挖掘中分类任务的一种有效方法,但在大规模测试数据集上运行时其实现性能受到严重影响.本文设计和实现一种基于MapReduce架构的并行决策树分类算法.实验结果表明:基于MapReduce的决策树分类算法比同类算法在其他并行编程模型下的实现在计算节点较多的情况下能得到更优的性能.  相似文献   

9.
基于数据挖掘的网络型误用入侵检测系统研究   总被引:4,自引:0,他引:4  
数据挖掘技术应用于网络型误用入侵检测系统中,比传统的网络型入侵检测有更大优势。数据挖掘是从大量数据中自动寻找规律的过程,它可以自动构建特征,同时提高了检测精确度,为检测未知攻击提供了可能性。介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了数据挖掘方法在入侵检测系统中的应用,并且从网络层和应用层2个层次得到实现。  相似文献   

10.
由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其在电信客户流失预测的应用方法,在提取并分析大规模客户呼叫图的极大团、结点膨胀率、结点聚集度等与节点稳定性相关的链接属性及其时变特征的基础上,提出了一种适合海量数据的基于链接的电信客户流失预测算法。实验结果表明,此算法较传统分类算法能提高客户流失预测性能,实现了基于链接分类方法的成功应用。  相似文献   

11.
分类是数据挖掘中的一个重要问题.概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在量化的相对约简格基础上,提出一种新的分类规则发现算法,该算法的生成结果剔除了冗余的分类规则,算法在时间性能、空间性能等方面均有较大的提高.  相似文献   

12.
 以中医方剂为研究对象,运用数据库挖掘、不确定性推理、机器学习等计算技术构建了一个数据挖掘平台;采用自主研制的“中医方剂数据库系统”(CPDBS)、“中医方剂智能分析系统”(CPIAS)、“中医方剂分类模式识别系统”(CPSVM)等软件,对中医方剂知识进行了挖掘研究。在中医方剂内涵知识的发现、方剂知识要点的形式化与量化计算、方剂模式分类识别等方面的研究成果表明:把对中医方剂知识的挖掘作为解读中医诊治思维的切入点,是实现把人的“经验”转化为“知识”的有效途径,对中医学的现代化研究具有现实意义。  相似文献   

13.
概念格是数据分析与知识提取的一种有效工具,具有精确性和完备性等特点.目前,基于概念格的分类规则提取算法很多,但在提取到规则的数量上和规则的形式上并不能达到令人满意的效果.针对基于概念格的分类规则提取方法进行了研究,在改进内涵缩减的增量式计算方法基础上给出了基于内涵缩减的确定的分类规则和近似的分类规则的提取方法,通过有效限制计算内涵缩减的节点的范围降低了内涵缩减的计算规模,利用分类规则基,降低了需要计算的分类规则的数量,提高了分类规则的提取效率.为验证本研究提出分类关联规则的挖掘方法,用C++实现了上述算法.测试结果表明,本文给出的算法是有效的.  相似文献   

14.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

15.
数据挖掘中分类算法的可扩展性研究   总被引:1,自引:0,他引:1  
分类是数据挖掘中最重要的技术之一,而且应用领域非常广泛,但面对新出现的海量数据,目前已有的许多分类算法不具备良好的伸缩性,不能从巨大的数据集中快速而准确地发现有用的知识.针对这一问题,本文对分类算法的可扩展性方法进行了深入的研究,并对各种方法进行了分析和对比,从而便于研究和开发者对已有的算法进行改进和扩展,以适应数据挖掘技术的不断发展.  相似文献   

16.
基于并行遗传算法的关联规则挖掘   总被引:1,自引:4,他引:1  
根据关联规则挖掘的要求与特点,结合并行遗传算法的思想,通过定义适应度函数,讨论了并行遗传算法在数据挖掘中的应用.结合一个实例,提出了基于并行遗传算法的关联规则的提取算法.  相似文献   

17.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

18.
基于遗传算法的地下遗址GPR数据分析   总被引:2,自引:0,他引:2  
作者以遗传算法(Genetic Algorithm)为手段,介绍一种探地遥感数据分类的新方法。从一系列EM雷达信号图像获得的必要的物体相关信息,基于简单遗传算法(SGA)对其进行数据采集处理可达到较好结果。图像经过与处理后,探测目标定位任务转换为曲线拟合。除了利用SGA的遗传性,在解决实际问题时加入了专家经验和环境条件。和传统的分类方法相比,遗传算法(GA)咋usouxun目标的速度和准确度上都有所提高。作者提出了在遗迹探测领域中对地下物体进行定位的一种可行的方法。在今后的工作中将使用复杂GA进行遗迹的三维建模。  相似文献   

19.
分类是把数据项映射到其中一个事先定义的类中的这样一个学习函数的过程.文章介绍分类数据挖掘的定义、分类的过程以及算法的分类,论述数据分类的常用技术,对分类的应用和分类算法的发展方向进行了展望.  相似文献   

20.
KDD^*模型是基于双库协同机制的知识发现新模型,是结构化数据挖掘领域研究的一个新的分支。为了进一步提高KDD^*的智能性,设计了一个基于Multi-agent技术的智能数据挖掘系统,利用多智能体技术,实现了数据预处理,数据挖掘,知识的自动获取,基础数据库与知识库的同步进化与协调,知识的评价与表示等功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号