首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
为提高文本分类的准确性和效率,构建了一种基于Attention的CNN-BiLSTM/BiGRU(简称CBLGA)混联文本分类模型.首先通过并联不同卷积窗口大小的CNN(Convolutional Neural Networks)网络同时提取多种局部特征,之后将数据输入至BiLSTM和BiGRU并联组合模型中,利用BiLSTM和BiGRU组合提取了与文本中的上下文有密切关系的全局特征,最后对两个模型所得到的特征值进行了融合并在其中引入了注意力机制.构建基于Attention的CNN-BiLSTM/CNN(简称CBLCA)混联文本分类模型,特点是将CNN的输出分为两部分,其中一部分输入BiLSTM网络中,另一部分则直接和BiLSTM网络的输出进行融合,既保留了CNN提取的文字序列局部特征,又利用了BiLSTM网络提取出的全局特征.实验表明CBLGA模型和CBLCA模型在准确率和效率方面均实现了有效提升.最后,建立了一套针对不同长度的文本进行相应预处理和后续分类工作的分类的流程,使模型无论面对长文本还是短文本数据,均实现了同时提高文本分类的准确率和效率的目标.  相似文献   

2.
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记. 该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记. 为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验. 为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-NewsGroup)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验. 实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率.  相似文献   

3.
基于领域知识的文本分类   总被引:3,自引:0,他引:3  
提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能.  相似文献   

4.
黄璐  谷军  李然  李向军 《科技信息》2013,(9):162-162,194
文本分类技术可以有效提高信息资源的可用性和利用率。提出一种基于改进的TF.IDF和支持向量机(SVM)结合进行多类别文本分类的方法。在文本的TF.IDF特征计算中,加入特征词权重,有效加强了重点词汇的特征标引作用。将提取出的文本特征向量送入组合SVM进行多类别文本分类。实验结果表明,本文提出的多类别文本分类方法具有较好的分类效果,为信息资源的充分利用了奠定良好基础。  相似文献   

5.
针对稀疏文本特征纬度高、特征稀疏程度大的特点,根据词、文档和所属类别的关系,建立训练样本的特征概率分布函数,通过基于内容的滤波器去除背景噪声和非关键词后,利用特征分类方法对稀疏文本进行分类.用线性回归的分类方法与其他传统分类方法进行了比较,结果表明,该特征分类方法能够有效提高稀疏文本的分类精度,尤其是与线性分类中的岭回归方法相结合时,分类精度更高.  相似文献   

6.
研究了基于向量空间模型的自动文本分类方法,提出了位置权和词的位置区分度的概念,给出了一个带有位置信息的词权重计算方法,并给出了基于该方法的文本分类算法.实验结果表明,该方法是有效的,提高了文本分类的精度.  相似文献   

7.
研究了统计语言模型中b igram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出了一种新的利用词对及词序信息来改善文本分类结果的方法.实验结果表明:该方法是可行且有效的.  相似文献   

8.
一种基于VSM文本分类系统的设计与实现   总被引:10,自引:0,他引:10  
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % .  相似文献   

9.
将文本分类理论应用于哈萨克语中,给出了哈萨克语文本预处理过程.介绍一种改进的KNN算法,并结合自己构建的哈萨克语料集实现基于改进KNN算法的哈萨克语的文本分类.仿真实验数据表明,该方法在哈萨克语的文本分类上获得了较好的效果.  相似文献   

10.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

11.
对经济模型的同构变换和条件转化的研究   总被引:1,自引:0,他引:1  
首先是对投入产出模型、差分模型和经济计量模型对于状态空间模型的同构变换研究;其次是对AD模型对于ECM模型以及线性规划模型对于动态规划模型的同构变换研究;最后是对AR(P)模型和传递函数模型对于ARMA(P,q)模型以及移动平均模型对于指数平滑模型的条件转化研究。  相似文献   

12.
通过一个生产质量监造系统具体地介绍了面向对象的建模过程,即如何对一个实际系统进行分析,建立对象模型、动态模型及功能模型,然后优化设计。  相似文献   

13.
针对城市产业规划中经济分析模型的复杂化特点,从减少模型库冗余性的角度,提出5条模型库设计原则,区分部件模型与执行模型,以可执行文件为部件模型形式,以数据序列描述执行模型,通过代数式数据化和执行模型数据化,增强了关系数据库的知识表达能力,改善了模型的可读性,并给出了混合型模型库管理系统的逻辑设计.  相似文献   

14.
给出了模型、模型章及模型库管理系统的基本概念,介绍了模型的常用分类,阐述了模型的表示方法,对模型的生成进行了分类及详细的探讨,最后指出了模型系统的发展方向。  相似文献   

15.
本文简述了数学模型的产生与发展指出了数学模型的分类,功能及建构模型的方法。  相似文献   

16.
文章讨论了ARCH模型族的拟合波动性的优缺点,建立ARMA-EGARCH-M模型,简要说明了此模型的优点;以2000年1月11日-2006年3月15日上证综指和深证成指收盘价为样本,对我国沪深股市收益率分布用ARMA-EGARCH-M模型进行拟合分析,结果表明该模型能更有效地拟合我国沪深股市的波动性;最后解释实证结果和分析了我国股市的行为。  相似文献   

17.
综述了原子核结构模型理论的研究与发展,首重介绍了低能有核结构模型--壳层模型,集体运动几何模型,集体运动代数模型的研究思想,方法和适用范围。  相似文献   

18.
研究了网络教育环境的技术构成 ,提出三种网络教育的技术模式 ,即模拟型、数字型和综合型 ,并对其教育传播特性进行横向对比研究 .  相似文献   

19.
根据邕江北大码头河段的地形资料和实测河道水文资料,进行糙率分析和室内模型试验研究,各项指标均达到足够精度,为论证北大码头对邕江河段行洪影响提供科学依据。  相似文献   

20.
计算机医学专家系统是当代计算机科学中人工智能的重要领域之一,而医学专家系统面临的重要问题之一就是对医学诊断系统进行定量的数字描述,建立较为精确的数字诊断系统,进而利用计算机及其智能语言进行处理;本文在这种思想的指导下,对心血管系统中扩张型心肌病、冠心病、心包积液和风心病的鉴别诊断进行了较为精确的数字描述以及数字诊断方法的一个数学模型的建立,为计算机医学专家系统提供了一个心血管方面的算法;最后对该算法进行了五十例的检验,未发现不符者:所以我们充分确信此算法是可靠的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号