首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 131 毫秒
1.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

2.
本文提出一种基于Vague相似矩阵的分类方法,以解决Vague集上的知识分类问题,并定义了所需的概念,设计了详细算法.实验分析表明了该方法的有效性.  相似文献   

3.
为了增强粗糙集理论中某些概念与运算的直观性,分别给出了可辨识布尔矩阵和分类系数的定义.用分类系数简捷地描述了粗糙集中的相关概念与运算.提出了基于可辨识布尔矩阵和分类系数的快速属性约简算法.  相似文献   

4.
田伟 《太原科技》2010,194(3):81-82
目前的遗传算法还普遍受限于模式定理,基于积木块假设的算法使得低阶短定义距的特征保留,影响到了算法的全局搜索能力。一种基于messyGA的分类算法,克服了只有低阶短定义距模式构成最优解的缺点,实验结果表明,该规则提取算法优于传统分类算法。  相似文献   

5.
报文分类已成为保障网络应用的服务质量及安全性的重要手段,而二维的前缀报文分类则是其中最为常用的.通过对规则冲突的分析,提出了一个基于三态内容可寻址存储器(TCAM)的二维前缀报文分类算法,该算法借助TCAM的并行查找能力,在一个指令周期内找到前缀的最长匹配,采用内存映像及相关数据结构消除了规则之间的冲突,实现了快速的二维前缀分类查找.与其他二维分类算法相比,该算法具有最小的查找时间复杂度和较小的内存空间复杂度.  相似文献   

6.
一种基于离散度的决策树改进算法   总被引:3,自引:0,他引:3  
在数据挖掘中,决策树方法是一个重点研究方向.很多学者从不同角度对ID3算法进行改进和优化,提高了分类的效率和速度.本文从离散度的角度,对ID3算法进行改进.实验表明,利用改进后的算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效.  相似文献   

7.
基于粗糙集的茶饮料味觉信号识别   总被引:4,自引:0,他引:4  
把粗糙集理论应用于茶饮料味觉信号分类规则的抽取,采用模糊C-均值聚类算法实现味觉信号的离散化,提出了一种新的规则强度定义。该定义同时考虑了支持规则的对象数和规则的不确定性因子,具有很好的普适性,同时给出一种规则提取算法和用于识别的决策算法,提取算法在获取全部有效规则的条件下.能有效减少核属性内的冗余。  相似文献   

8.
针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.  相似文献   

9.
一种改进的SVM算法及其在证券领域中的应用   总被引:2,自引:0,他引:2  
根据传统的SVM算法原理,提出一种新的基于连续的和过程化的SVM算法,该算法在分类结果上不再局限于两类分类问题的离散情况,是一种支持向量的动态选择算法.将该算法应用于证券领域中,结果表明该算法是有效且正确的.  相似文献   

10.
小天鹅行为谱的初步建立   总被引:4,自引:0,他引:4  
动物行为谱的研究内容是行为型式(behaviouralpatterns)的描述,它的建立是一个十分复杂的过程.本文在对上海动物园自由生活小天鹅行为长达两年的观察基础上,对所遇见的主要行为用比较标准化的行为术语进行了定义、描述及分类.共区分和定义了32个行为型式,可分成静止、社会、梳理、取食、运动五大行为类型.上海师范大学校基金资助,上海动物园协助完成.  相似文献   

11.
基于BP神经网络的湿地遥感分类   总被引:1,自引:0,他引:1  
遥感图像分类的实质是通过计算机对图像像元进行数值处理,达到自动识别地物的目的.在对国内外湿地遥感分类研究的基础上,用BP神经网络方法对湿地遥感分类进行了研究,并与最大极然法进行精度比较分析.结果表明:BP神经网络分类法是一种有效的湿地分类技术,能够提高分类精度.  相似文献   

12.
分类回归树中分裂法则的相合性质   总被引:1,自引:2,他引:1  
讨论度量误差对分类树回归结果的影响,证明了对于某些常用的分裂法则来说,度量误差的存在会影响类边界估计的相合性.在一种简单情况下,提出了一个分裂法则,在该法则下,度量误差的存在不会影响类边界的相合性.  相似文献   

13.
基于XML的Web数据挖掘技术   总被引:5,自引:0,他引:5  
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法.  相似文献   

14.
The mining industry faces a number of challenges that promote the adoption of new technologies. Big data, which is driven by the accelerating progress of information and communication technology, is one of the promising technologies that can reshape the entire mining landscape. Despite numerous attempts to apply big data in the mining industry, fundamental problems of big data, especially big data management(BDM), in the mining industry persist. This paper aims to fill the gap by presenting the basics of BDM. This work provides a brief introduction to big data and BDM, and it discusses the challenges encountered by the mining industry to indicate the necessity of implementing big data. It also summarizes data sources in the mining industry and presents the potential benefits of big data to the mining industry. This work also envisions a future in which a global database project is established and big data is used together with other technologies(i.e., automation), supported by government policies and following international standards. This paper also outlines the precautions for the utilization of BDM in the mining industry.  相似文献   

15.
Web企业信息挖掘是Web数据挖掘的一个具体应用,主要针对用户所关心的大量企业信息进行数据挖掘的过程。对Web企业信息数据挖掘进行可行性研究,并提出了一种高效准确的实验设计方案。  相似文献   

16.
本文论证了采用关联规则算法进行数据挖掘,以发现课程之间相关性的可行性。数据挖掘部分采用经典的Apriori算法,并引入了感兴趣度的概念,对挖掘结果进行进一步的清理,从而提高了系统的性能。  相似文献   

17.
电子商务过程中产生了大量的数据,数据挖掘是对这些数据进行分析的有效方法。介绍了数据挖掘在电子商务中的应用,探讨了电子商务中数据挖掘的步骤和数据挖掘的体系结构。  相似文献   

18.
数据挖掘的探讨   总被引:1,自引:0,他引:1  
从数据挖掘的定义出发,探讨了数据挖掘的流程、数据挖掘中出现的问题以及数据挖掘的应用前景。  相似文献   

19.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

20.
数据挖掘是一种新兴的信息处理技术,模糊聚类是数据挖掘领域中的一个重要研究课题。论文从数据挖掘的概念出发,研究分析了模糊聚类的主要算法,并从多个方面对这些算法性能进行比较,同时还对模糊聚类分析在数据挖掘中的应用进行了阐述,最后对模糊聚类的研究领域进行了总结和展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号