首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

2.
一种快速属性约简算法   总被引:5,自引:1,他引:5  
基于差别矩阵的属性约简算法,先要求出差别矩阵,随着问题的规模增大,存放差别矩阵的空间和算法的执行时间过大和过长,让计算机难以承受.针对这一问题,提出了差别对象对集的定义,给出了基于差别对象对的属性约简定义,并证明了该定义等价于基于差别矩阵的属性约简定义.利用差别对象对,设计了一个新的属性约简算法.由于这一算法在求属性约简的过程中不用生成差别矩阵和大量的无用元素,因而大大减少了存储量和计算量,从而提高了算法的效率.计算实例说明了新算法的高效性.  相似文献   

3.
本文提出一种基于Vague相似矩阵的分类方法,以解决Vague集上的知识分类问题,并定义了所需的概念,设计了详细算法.实验分析表明了该方法的有效性.  相似文献   

4.
基于形式化概念分析的XML Schema映射   总被引:6,自引:0,他引:6  
XML Schema映射关系的求取对于异构系统的整合起着至关重要的作用.基于此,提出了一种利用形式化概念分析的XML Schema映射算法.该算法使用传统分类技术,并结合形式化概念分析中的相关定义,创建概念格.在概念格上运用新定义的运算规则特化规约和启发式规则推理获得映射.给出了算法所基于的蕴涵于两个Schema所构建交叉表中的定理以及相应的证明.  相似文献   

5.
为了增强粗糙集理论中某些概念与运算的直观性,分别给出了可辨识布尔矩阵和分类系数的定义.用分类系数简捷地描述了粗糙集中的相关概念与运算.提出了基于可辨识布尔矩阵和分类系数的快速属性约简算法.  相似文献   

6.
田伟 《太原科技》2010,194(3):81-82
目前的遗传算法还普遍受限于模式定理,基于积木块假设的算法使得低阶短定义距的特征保留,影响到了算法的全局搜索能力。一种基于messyGA的分类算法,克服了只有低阶短定义距模式构成最优解的缺点,实验结果表明,该规则提取算法优于传统分类算法。  相似文献   

7.
为提高分类挖掘的准确度,在分析ID3,C4.5和进化算法(EC)的基础上,设计了两个共同进化的种群分别表示选择的属性子集和分类规则子集,提出基于共同进化计算的分类规则算法(CRCEC),并构建CRCEC算法的适应度评价函数.用4个加利福尼亚大学Irvine分校的数据集对CRCEC,ID3,C4.5和EC算法进行测试比较,结果表明CRCEC算法分类准确度高,可以得到简洁的、可理解性强的规则.最后给出了CRCEC算法在公路车辆征费分类预测系统中的一个应用实例.  相似文献   

8.
基于频繁模式树的关联分类规则挖掘算法   总被引:1,自引:1,他引:1  
构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务.提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案.试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4.5更好的分类效果.  相似文献   

9.
一种基于离散度的决策树改进算法   总被引:3,自引:0,他引:3  
在数据挖掘中,决策树方法是一个重点研究方向.很多学者从不同角度对ID3算法进行改进和优化,提高了分类的效率和速度.本文从离散度的角度,对ID3算法进行改进.实验表明,利用改进后的算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效.  相似文献   

10.
报文分类已成为保障网络应用的服务质量及安全性的重要手段,而二维的前缀报文分类则是其中最为常用的.通过对规则冲突的分析,提出了一个基于三态内容可寻址存储器(TCAM)的二维前缀报文分类算法,该算法借助TCAM的并行查找能力,在一个指令周期内找到前缀的最长匹配,采用内存映像及相关数据结构消除了规则之间的冲突,实现了快速的二维前缀分类查找.与其他二维分类算法相比,该算法具有最小的查找时间复杂度和较小的内存空间复杂度.  相似文献   

11.
基于BP神经网络的湿地遥感分类   总被引:1,自引:0,他引:1  
遥感图像分类的实质是通过计算机对图像像元进行数值处理,达到自动识别地物的目的.在对国内外湿地遥感分类研究的基础上,用BP神经网络方法对湿地遥感分类进行了研究,并与最大极然法进行精度比较分析.结果表明:BP神经网络分类法是一种有效的湿地分类技术,能够提高分类精度.  相似文献   

12.
分类回归树中分裂法则的相合性质   总被引:1,自引:2,他引:1  
讨论度量误差对分类树回归结果的影响,证明了对于某些常用的分裂法则来说,度量误差的存在会影响类边界估计的相合性.在一种简单情况下,提出了一个分裂法则,在该法则下,度量误差的存在不会影响类边界的相合性.  相似文献   

13.
基于XML的Web数据挖掘技术   总被引:5,自引:0,他引:5  
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法.  相似文献   

14.
The mining industry faces a number of challenges that promote the adoption of new technologies. Big data, which is driven by the accelerating progress of information and communication technology, is one of the promising technologies that can reshape the entire mining landscape. Despite numerous attempts to apply big data in the mining industry, fundamental problems of big data, especially big data management(BDM), in the mining industry persist. This paper aims to fill the gap by presenting the basics of BDM. This work provides a brief introduction to big data and BDM, and it discusses the challenges encountered by the mining industry to indicate the necessity of implementing big data. It also summarizes data sources in the mining industry and presents the potential benefits of big data to the mining industry. This work also envisions a future in which a global database project is established and big data is used together with other technologies(i.e., automation), supported by government policies and following international standards. This paper also outlines the precautions for the utilization of BDM in the mining industry.  相似文献   

15.
Web企业信息挖掘是Web数据挖掘的一个具体应用,主要针对用户所关心的大量企业信息进行数据挖掘的过程。对Web企业信息数据挖掘进行可行性研究,并提出了一种高效准确的实验设计方案。  相似文献   

16.
本文论证了采用关联规则算法进行数据挖掘,以发现课程之间相关性的可行性。数据挖掘部分采用经典的Apriori算法,并引入了感兴趣度的概念,对挖掘结果进行进一步的清理,从而提高了系统的性能。  相似文献   

17.
数据挖掘的探讨   总被引:1,自引:0,他引:1  
从数据挖掘的定义出发,探讨了数据挖掘的流程、数据挖掘中出现的问题以及数据挖掘的应用前景。  相似文献   

18.
电子商务过程中产生了大量的数据,数据挖掘是对这些数据进行分析的有效方法。介绍了数据挖掘在电子商务中的应用,探讨了电子商务中数据挖掘的步骤和数据挖掘的体系结构。  相似文献   

19.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

20.
Visual data mining is one of important approach of data mining techniques. Most of them are based on computer graphic techniques but few of them exploit image-processing techniques. This paper proposes an image processing method, named RNAM (resemble neighborhood averaging method), to facilitate visual data mining, which is used to post-process the data mining result-image and help users to discover significant features and useful patterns effectively. The experiments show that the method is intuitive, easily-understanding and effectiveness. It provides a new approach for visual data mining.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号