首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种基于TAN的文本分类方法   总被引:1,自引:3,他引:1  
提出了一种基于TAN模型的文本分类方法,朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented Naive Bayes)是综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力,其分类性能可与当前流行的一些分类器相竞争,介绍了TAN模型,将其引入到文本分类中,并用实验比较了朴素贝叶斯和TAN,实验结果表明:该方法具有较好的分类性能。  相似文献   

2.
针对最大流问题的研究现状,提出了分层求解最大流的简单方法,并给出了该方法可行的严格证明。该方法首先求得层次网络的阻塞流,进而最终求得一个最大流。另外,该方法还针对有向流网络的特点,将算法中涉及的流网络、剩余网络和层次网络共用一个网络结构,既有效地降低了算法的空间复杂度,还大大提高了算法的执行效率。  相似文献   

3.
朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而,由于学习TAN所需的空间是数据属性个数的二次项级,限制了TAN对高维数据(如:文本数据)的分类,本文介绍了TAN模型及其一般的构造算法,提出一种新的TAN构造算法ITAN,该算法的空间复杂度是数据属性个数的线性级,最后将该算法用于文本分类,实验比较了朴素贝叶斯分类器和TAN分类器,实验结果表明:该方法具有较好的分类性能。  相似文献   

4.
针对人工免疫存在的对样本要求高以及压缩阈值难以确定等问题,结合免疫算法和计算机检测的特点,提出了基于双记忆细胞层网络结构和网络邻近细胞消除规则的改进免疫方法.此外,基于物理中量子能级概率分布,提出了一种分层边界的策略.经VC环境下仿真实验,该方法在存在干扰和样本分布不理想时能够简单确定压缩阈值,有较强的适应性,提高了分类的准确率.  相似文献   

5.
针对信息搜索与挖掘中存在的关键词多义性及用户对所要查询信息的分类存在一定的模糊性问题,提出了一种基于模糊分类网络的信息挖掘方法。该方法利用模糊分类网络固有的对模糊信息的非线性处理能力和自适应学习机制,通过对WEB页面大量分类文档信息的学习,建立了基于模糊分类网络的信息分类器和挖掘模型。构造的信息分类模型结构简单、学习收敛速度快且易于实现。文中给出了分类策略和实现算法,并以中国石油网油气管道专题信息分类为例验证了方法的有效性。  相似文献   

6.
阐述了ART1网络的基本原理,提出了一种基于ART1网络的图书分类方法,实验表明,ART1网络有较强的抗噪声能力,可有效地实现图书分类,并能产生新的分类,有较好的应用价值。  相似文献   

7.
针对超多标签分类(SMLC)带来的数据稀疏性和可扩展性等问题,根据深度卷积神经网络(CNN)提出了基于层次型标签集的文本分类方法,以完成数据标签规范化.该方法对每个文档的标签集进行扩展,并整合了标签层次结构中所有缺失的标签.通过CNN实施特征提取模块,以及由全连接神经网络组成分类模块.此外,分析了在输入训练文本的表征中...  相似文献   

8.
层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中.当利用HMC-loss预测时,尽管得到的损失值是理想的,但实际预测的标签数却远多于真实的标签数.另外,层次信息的引入会对标签结点的决策顺序产生不利影响.针对这些问题,首先提出改进的损失函数IMH-loss,其次使用贝叶斯决策理论,提出了一种贝叶斯风险随决策过程可变的层次多标签分类方法.在真实数据集上的实验结果表明,该方法在保证召回率的同时,提升了标签预测精度.  相似文献   

9.
概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层次文本分类方法. 该方法首先利用Gibbs抽样提取一系列主题,然后计算测试文档和每个类的基于主题的相似度.在20 NewsGroups数据集上的实验结果表明,该方法的分类性能明显超越支持向量机分类方法.  相似文献   

10.
研究提取耕地的方法是为了提高耕地提取的高效性,直接目视解译时山体阴影和水体难以区分,建设用地和未种植的耕地难以区分,本文主要以2015年的Landsat 8遥感影像,借助辅助数据DEM及MODIS-NDVI等多源数据基于eCognition平台应用多阈值分割、多尺度分割将影像进行分割成对象,再分别用阈值法、归一化水体指数(NDWI)、增强的指数型建筑指数(EIBI)等将坡度大于25度的地区、水体、建设用地剔除。最后利用影像的波段特点及MODIS-NDVI值进行多次提取研究区耕地,以达到较高精度的分类方法。利用总体面积精度及空间分布进行精度评价。其总体面积精度达到98.84%,且提取出的耕地分布情况符合作物的种植规律。  相似文献   

11.
针对高校计算机基础课程教学中存在的问题,提出了以培养学生计算机技能和信息化素养为核心的分类分层次教学改革思想,并依托网络学习环境,以"学生为本、突出引导、重在能力、提高素质"的教学理念探索课堂学习和网络学习相结合的多元化教学模式,全面提升计算机基础课程教学质量.  相似文献   

12.
现阶段,高校计算机课程在教学中存在一些问题,根据对这些问题的探讨与研究,需要对教学改革进行分类分层次改革,以提高学生的计算机操作能力与专业素养。并且要利用好网络,以网络为依托,将课堂学习与网络学习相结合,使计算机基础课程的教学质量得到全面提高。  相似文献   

13.
利用Rosenblatt感知器网络的权值学习方法,提出一种解决线性不可分样本的多类分类方法.该方法不需要考虑使用何种核函数,将高维坐标值作为分类信息的函数,直接解决非线性多类分类问题.对双螺旋线数据分类应用的结果表明:基于高维映射感知器网络的多类分类机器学习方法可以有效解决非线性数据的分类问题,并能够提高分类效率和准确度.  相似文献   

14.
针对脑肿瘤磁共振图像分类问题中过拟合及分类准确率较低的问题,提出一种基于改进EfficientNetV2网络的脑肿瘤分类方法.该方法在EfficientNetV2网络中引入坐标注意力机制,该注意力机制将同时从垂直和水平两个方向获取脑肿瘤的特征信息,精准识别脑肿瘤的病灶特征,从而帮助模型更全面、准确地定位和识别病灶区域信息,有效抑制背景信息对检测结果的影响,使模型分类精度更高,解决了因获取特征信息不足导致分类精度低的问题.为进一步提升分类准确率,引入Hard-Swish激活函数,该激活函数不仅可以提升脑肿瘤分类网络模型的运算速度,也可有效提高分类精度.同时,改进后的模型搭配了Dropout层和归一化层,可更好抑制过拟合的发生,加快模型收敛速度,提高模型的鲁棒性,且分类精度有明显提升.实验结果表明,改进后的模型在验证集中获得了98.4%的分类准确率,通过对比实验和消融实验验证了改进后的模型在脑肿瘤分类任务中的有效性.  相似文献   

15.
多边形网格作为一种复杂的数据结构为三维物体提供了有效的形状近似表示,但由于网格数据的复杂性和不规则性,卷积神经网络很难直接应用到三维网格数据处理中.因此,提出一种基于胶囊网络的深度学习方法对三维网格数据进行有效分类.首先设计一种能够直接在网格表面进行计算的多项式卷积模板,提取三维网格模型的高阶参数特征.同时,为解决传统...  相似文献   

16.
基于演化超网络的中文文本分类方法   总被引:2,自引:0,他引:2  
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以X2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.  相似文献   

17.
提出了一种网络信息文本分类模型的建立方法,根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型,分别进行了基于最近邻决策和K-近邻决策的分类效果试验研究,结果显示,K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

18.
提出了一种网络信息文本分类模型的建立方法。根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型。分别进行了基于最近邻决策和K-邻近决策的分类效果试验研究,结果显示:K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

19.
针对关系分类主流模型中存在的空间信息丢失和旋转不变性差的缺点,提出一个基于BERT和多头注意机制-胶囊网络(MA-CapsNet)的算法模型.该模型首先在句子的实体两端插入特殊符号,增强模型对实体信息的表示能力,再通过预训练的BERT语言模型获得包含上下文信息的语义向量表示,然后传入改进后的注重空间位置信息的胶囊网络中学习句子的语义特征并分类.同时引入多头注意力机制进一步提升模型的分类效果.在SemEval-2010 task 8关系分类数据集上,该算法模型取得了90.15%的宏F值.实验表明该模型架构能强化对句子语义特征的捕捉,改善关系分类任务的分类效果.  相似文献   

20.
针对传统长短时记忆网络(long short-term memory,LSTM)在文本分类中无法自动选取最重要潜在语义因素的问题,提出一种改进的LSTM模型。首先,将传统LSTM的运算关系拓展为双向模式,使网络充分记忆输入特征词的前后关联关系;然后在输出层前面增加池化层,以便更好选择找到最重要的潜在语义因素。互联网电影资料库评论数据实验结果表明,该模型优于传统长短时记忆神经网络以及其他同类模型,揭示了改进方案对提高文本分类准确率是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号