首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
介绍了文本分类的思想,探讨了通过决策树学习来对文本进行有效分类的过程。  相似文献   

2.
文本分类是指按照预先定义的主题类别,为文档集合中的每个文档确定一个类别,文本分类是文本挖掘的一个重要内容。本文分别介绍了文本分类技术和支持向量机的概念,并阐述了支持向量机(SVM)在文本分类中的应用及其发展趋势。  相似文献   

3.
刘冬雪 《科技资讯》2010,(18):11-11
本文研究的内容是信息检索领域里的文本分类问题。文本分类可以在较大程度上解决信息杂乱的现象,同时它也为信息检索提供了更高效的搜索策略和更有效的搜索结果。  相似文献   

4.
简述了搜索引擎的概念,对其工作原理、性能指标等做了简要介绍。在现有搜索引擎工作机制的基础上,提出将文本分类和特征抽取技术应用到搜索引擎系统中以提高检索质量,并对该系统的设计思想、关键技术及可行性进行了讨论。  相似文献   

5.
量子神经网络在心电图分类中的应用   总被引:1,自引:0,他引:1  
将量子叠加的概念引入前向神经网络,提出了量子神经网络的计算模型.量子神经网络分类器是将量子迁移(量子间隔)概念引入前向神经网络,在隐含层和输出层借鉴量子理论中的量子迁移(量子间隔)思想,神经元采用多个激励函数的叠加,形成对特征空间的多级划分,在训练过程中,量子神经元能够根据需要伸展或坍塌.当输入模糊信息时,该算法可以学习数据集中的不精确性或不确定性,具有较高的分类精度.将该算法应用于心电图诊断中,结果表明具有较好的分类效果和较快的训练速度.  相似文献   

6.
BP神经网络在数据挖掘分类中的应用   总被引:2,自引:0,他引:2  
结合人工神经网络对噪声数据具有高承受能力,且对未经训练的数据具有分类模拟能力的特点,讨论了在数据挖掘领域中利用BP网络进行数据分类的实现过程,描述并分析了BP算法.然后,针对银行业务中客户信用政策给出了实例分析,用该算法建立了一个分类模型,根据存款金额、贷款次数、及时还贷率等数据信息实现对客户信用等级的分类.  相似文献   

7.
为了提高模型在文本分类任务中的分类性能,针对图神经网络中存在的过度平滑问题,同时增强模型在处理文本特征与文本表示方面的能力,提出了一种基于多状态图神经网络的文本分类算法(multi-state graph neural network, MSGNN)。多状态图神经网络是利用网络层的多个历史状态信息对图神经网络进行强化,构建合理的文本图结构数据作为模型输入。在缓解网络层过度平滑问题的同时,结合2种改进后的不同类型的图神经网络来增强模型的特征提取与特征聚合能力。利用多头自注意力机制对文本关键词的挖掘与利用能力,从多个文本子空间来生成高质量的文本表示,进而完成文本分类。通过在几个公开的文本分类数据集上进行实验分析,相较于其他神经网络的文本分类算法,该方法取得了较好的分类准确率。  相似文献   

8.
Web文本分类是Web文本挖掘的一项重要技术,它是一种基于主题分类的指导,能够使用户在快速地找到想要的资源和知识。文本分类过程中,首先采用向量空间模型对Web文本进行特征提取,然后将得到的数据集分成样本数据集和测试数据集,将样本数据集输入BP神经元网络进行分类,网络经过训练后,输入测试数据集进行验证。实验结果证明BP神经元网络在文本分类领域有着较好的实用价值。  相似文献   

9.
Boosting算法在文本自动分类中的应用   总被引:7,自引:0,他引:7       下载免费PDF全文
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。  相似文献   

10.
基因遗传算法在文本情感分类中的应用   总被引:1,自引:0,他引:1  
本文以微博文本为主要实验对象,提出适合卷积神经网络进行自我优化的编码方式,分别将每一层看做是一个染色体,将每一层中的参数看做是一个基因片段,采用混合双重非数值编码的方式编码每个CNN框架,设计出适合于CNN网络的选择、交叉和变异的算法,并且把基因遗传算法(GA)和与卷积神经网络相结合,提出了基于情感分析算法的遗传算法(GA-CNN).通过对传统算法与GA-CNN的实验与对比分析,良好地展示了自我优化性.  相似文献   

11.
二进制粒神经网络及其在分类中的应用   总被引:1,自引:0,他引:1  
为了提高分类器的正确识别率并降低特征选择的时间复杂度, 提出二进制粒神经网络框架.在该框架下,提出一种二进制粒神经网络分类算法.该算法通过二进制粒矩阵将特征空间进行最优约简,并利用基于BP的学习算法实现分类;将该算法在UCI数据集上进行测试,并与BP神经网络分类算法进行比较.仿真实验表明,二进制粒神经网络分类算法比BP神经网络分类算法分类正确率更高,泛化能力更强,是一种有效可行的分类算法.  相似文献   

12.
为了有效地组织和分析大量WEB信息,本文设计了WEB分类发掘系统.BP网络应用广泛,但也有许多不足之处.因此,提出了用RBFNN(径向基函数神经网络)分类WEB页面信息的方法.分类系统框架主要包括RBF(径向基函数)分类器、评估模型及数据预处理.用Macro-Fi作为分类效果的评估标准,实验结果证实,RBFNN分类器比BPNN分类器更有效、更准确.并且用相同的分类器对不同类进行分类,分析了不同分类精度.  相似文献   

13.
改进型遗传神经网络在模式分类中的应用   总被引:1,自引:0,他引:1  
为研究图像和语音的模式分类,提出一种采用可变长度串遗传算法(VGA)的进化神经网络.该算法可以全局搜索优化神经网络的结构,找到神经网络接近最优的连接权,再通过反向传播算法(BP),在该优化结构中找到最优连接权.对语音数据和SPOT图像数据的验证结果表明,在模式分类中,采用该算法的分类器(VGA-BP)的分类性能较贝叶斯(Bayes)分类器、最近邻规则(k-NN)分类器具有更高的分类精度.  相似文献   

14.
为了有效地组织和分析大量WEB信息,本文设计了WEB分类发掘系统。BP网络应用广泛,但也有许多不足之处。因此,提出了用RBFNN(径向基函数神经网络)分类WEB页面信息的方法。分类系统框架主要包括RBF(径向基函数)分类器、评估模型及数据预处理。用Macro-Fi作为分类效果的评估标准,实验结果证实,RBFNN分类器比BPNN分类器更有效、更准确。并且用相同的分类器对不同类进行分类,分析了不同分类精度。  相似文献   

15.
遗传算法与神经网络在模式分类中的应用   总被引:2,自引:0,他引:2  
作者在本文中介绍了怎样利用遗传算法对多层神经网络的结构进行优化,并通过模式分类模拟了实验,说明该方法是可行的、有效的。  相似文献   

16.
数字视频数据中的文本能提供重要的语义信息,用具有良好时频局部特性和变尺度特征的小波分析方法,提取图像中的尺度-空域特征,经神经网络分类进行分类后,自动检测视频数据中的文本信息,为基于内容的视频检索提供索引,实验表明该检测方法效果良好。  相似文献   

17.
使用基于长短项记忆(LSTM)和门阀递归单元(GRU)计算节点的双向递归神经网络提取文本特征,然后使用softmax对文本特征进行分类。这种基于深度学习的神经网络模型以词向量作为基本输入单元,充分考虑了单词的语义和语法信息,并且在神经网络的计算过程中严格遵守单词之间的顺序,保留原文本中语义组合的方式,可以克服传统文本分类方法的不足。使用本文所提方法在第三届自然语言处理和中文计算会议(NLPCC 2014)公布的新华社新闻分类语料和路透社RCV1-v2语料上进行实验,其分类F1值分别达到了88.3%和50.5%,相较于传统的基线模型有显著的提升。由于该方法不需要人工设计特征,因此具有很好的可移植性。  相似文献   

18.
为了解决分类算法在文本分类时出现特征维度过高和数据稀疏的间题,提出了一种基于卷积神经网络(convolutional neural network,CNN)的文本分类算法,该算法结合卷积神经网络论中的邻接矩阵对文本分类进行动态建模。对文本的词向量进行训练,并且通过分类邻接矩阵得到群的结构和个数分类。在提取出文本抽象特征的基础上用CNN分类器来进行分类。仿真分析表明:该算法在在进行文本分类效果显著。  相似文献   

19.
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集,如果训练集的数据量较大,则容易出现特征项不明确,特征信息丢失等缺陷,为解决上述问题,提出运用“深度学习”中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类。实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机,但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率。  相似文献   

20.
针对模式分类任务,提出一种基于粗糙集规则的神经网络构造方法.首先,利用粗糙集理论和遗传算法约简输入特征,在尽量保持分类能力不变的情况下降低条件属性维数,并推导出简练的分类规则集合.然后,以规则集为基础构造BP神经网络结构、确定网络层数、输入输出节点数等,并计算规则的条件属性重要度和依赖度2个参数对连接权值进行初始化.最后,通过一个实例验证了方法的有效性,结果表明该方法能有效解决传统神经网络构造难、解释难、过拟合等问题,提高了分类精度,降低了训练时间.此外,初步探讨了网络训练时对知识提炼的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号