首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法.  相似文献   

2.
设计了一种基于VSM模型的动态文本分类器,它能针对文本的不同类别建立不同的特征子空间,各特征子空间之间相互独立,同时能将文本分类中常用的2个评估指标召回率和精确率转化为正确分类率和错分率;考察了特征子空间的维数和判定界值对这2个指标的影响.该动态文本分类器能对用户输入的文本流进行动态分类.  相似文献   

3.
网络化与信息化社会具有信息海量化和用户需求个性化的特点,如何通过有效手段过滤掉与目标用户不相关的信息,筛选出对用户有用、能满足用户需求的信息成为信息研究领域的重要课题。本文针对协同过滤中存在的评分数据稀疏性与推荐准确度问题,提出了一种基于项目特征值分类与空缺元素填充的协同过滤算法。实验结果表明,改进的协同过滤算法能有效的缓解评分数据稀疏性对推荐结果的负面影响,在一定程度上提高了推荐的准确度。  相似文献   

4.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

5.
决策树分类ID3算法研究   总被引:1,自引:0,他引:1  
张桂杰  王帅 《松辽学刊》2008,29(3):135-137
分类是数据挖掘的重要内容之一,在许多领域得到广泛应用,现已有多种分类方法,其中决策树分类法在海量数据环境中应用最为广泛,本文分析了决策树分类ID3算法的原理,给出构造决策树的基本算法,指出ID3算法构造决策树的优缺点,针对ID3算法倾向于取值较多的测试属性的缺点,引入一个参数来约束属性选择,给出一种优化算法.  相似文献   

6.
针对LSSVM的网络入侵检测技术存在检测率低和误判率高的缺点,针对果蝇优化算法易陷入"早熟"和局部最优的问题,将修正因子引入果蝇优化算法,提出一种修正的果蝇优化算法(Modified Fruit Fly Optimization Algorithm,MFOA),避免果蝇优化算法陷入局部最优.在MFOA算法的基础上,提出一种MFOA优化LSSVM的IPV6网络入侵检测方法.以KDD CUP99数据集为研究对象,研究结果表明,MFOA__LSSVM算法在检测率和误判率指标上均优于FOA__LSSVM和LSSVM,MFOA__LSSVM算法的网络入侵检测率平均高达96.33%.  相似文献   

7.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

8.
全景图应用领域广阔,为了获取全景图,图像拼接是其中关键技术.图像拼接是将多幅存在一定重叠部分的图像进行匹配,经融合后拼接成一个视野较宽,场景完整的图像.兼顾算法的精度和效率2个方面,提出一种基于随机一致性(RANSAC)算法的图像拼接方法.在VS2013环境下,结合Opencv,对室内图像及自然光照环境下采集的2幅图像...  相似文献   

9.
董贺  荣光怡 《松辽学刊》2008,29(4):107-108
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

10.
针对标记重要性不同,且这种不同可能会为多标记学习提供一定的信息,该文提出了基于标记重要性的多标记特征选择算法.该算法首先引入核函数将特征空间映射到一个新的可分性强的特征空间,在映射后的特征空间中利用标记对样本的可分性对标记赋以权重;其次,在每个新映射的特征空间计算样本的分类间隔,并将该间隔作为特征权重来衡量特征的重要性;最后,联合标记权重和特征权重,对特征进行排序,得到一组新的特征重要性排序.实验结果表明:该算法优于一些当前流行的多标记特征选择算法.  相似文献   

11.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

12.
为了得到核Bayes函数作为分类器的核主元分析(KPCA)与核Fisher判据分析(KFDA)的算法模式稳定性,利用Rademacher复杂度的概念及相关定理,推导出了核Bayes函数Rademacher复杂度的界以及其作为分类器的算法发生错误分类的概率的界,说明了模式稳定性与样本长度、降维矩阵的维数等关系,提出了两种衡量模式稳定性的直观指标,误分差和百分比和误分均值偏离度.仿真结果不仅验证了几个定理,也表明所提出的衡量指标是有效的、可行的.  相似文献   

13.
本文在人脸检测与识别技术理论研究的基础上,提出了一种有效的人脸检测与识别机器学习方法.该方法采用了海尔特征级联的AdaBoost分类器进行人脸检测,使用了特征脸的主分量分析法进行人脸识别.实验结果表明该方法能较快地定位并跟踪人的脸部,然后通过比较人脸数据库能较好地识别出待检人物的身份.  相似文献   

14.
本文针对基于视觉导航的无人驾驶汽车导航系统,提出一种基于OpenCV的传统摄像机标定方法实现摄像机标定算法.最后,通过测量标定板的顶点坐标来验证导航系统标定算法的精确度.实验结果表明,采用该标定算法测量系统的定位精度高,而且具有实用、简便、快速等优点.  相似文献   

15.
RBF神经网络中心值的确定是个关键的问题,在很大程度上决定了RBF网络性能的好坏.该文采用遗传算法对RBF神经中心进行优化,并将优化后的RBF神经网络用于非线性函数逼近,实例证明取得了较好的效果.  相似文献   

16.
针对可见光和红外热像仪各自的成像特性,提出了一种新的基于小波变换的图像融合算法,将配准完成的电视图像和红外图像分别进行小波分解,得到低频图像和高频图像。采用不同的规则分别对低频图像和高频图像进行融合,并进行小波逆变换,得到最终的融合图像。最后采用实验验证了算法的有效性,结果表明,该算法明显优于传统小波变换算法。  相似文献   

17.
基于粗集的ID3算法研究   总被引:5,自引:0,他引:5  
决策树是数据挖掘任务中分类的常用方法,ID3算法是经典的决策树生成算法,它的核心是通过计算各个属性的信息熵来确定最好的分枝结点.给出一种用粗集的方法计算信息熵,应用ID3算法来生成决策树.  相似文献   

18.
近几年来,单元化制造系统(CMS)作为一种由于能满足不同客户需求、缩短产品生产周期、提高企业的全球竞争力的先进制造组织模式而备受关注。本文提出了一种新的矩阵聚类方法(HERBAL)设计制造单元,并探讨了该方法与其它聚类方法如ROC、ROC2、DCA等方法在成组效率、成组功效等评价指标上的优劣,证明了该方法的可行性和高效率。同时该方法中的设备_零件矩阵(MCM)中的二元值元素,采用反映实际生产中的流程时间替代,可使聚类结果更符合实际的生产需求。  相似文献   

19.
针对支持向量分类机对偶问题建立了灵敏度分析定理.该定理可以得到支持向量分类机对偶问题的解及决策函数对输入数据参数的偏导数;该定理可以定量分析输入数据误差以及数据各种变化对支持向量机模型解及其对应的决策函数值的定量影响,为解决支持向量分类机的稳定性问题奠定基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号