首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型. 首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类. 实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果.  相似文献   

2.
通过引入模糊认知图进行文本分类模型研究,即在向量空间模型、粗糙集等方法基础上使用模糊认知图进行文本分类,指出这一研究不仅大大约简文本空间向量的冗余属性,降低研究的规模与复杂性,提高工作效率,而且该研究将使文本分类通过迭代计算考虑到各向量间的影响。  相似文献   

3.
为提高计算机对古典诗歌自动分类的准确性,提出一种基于特征项聚合的分类方法.首先从文本中提取特征项并用向量表示,向量的每一分量表示该特征项在不同类别中的比重;然后通过聚类算法把相似的特征项聚合为一组,从而形成特征项聚合的诗歌模型;最后利用分类器对诗歌进行分类.《全唐诗》语料库的实验结果表明,利用该模型及算法可明显提高诗歌分类的准确率.  相似文献   

4.
为了有效获取交通运输信息标准中的一致性条款,简化标准测试方法,针对现有文本分类方法中卷积神经网络存在的缺少上下文含义和循环神经网络存在的梯度消失及梯度弥散等问题,提出一种基于BLSTM的文本增强表示方法和基于CNN网络的语句分类相结合的方法进行一致性条款分类.其核心思想是将BLSTM前向和后向过程产生的向量相加,然后与原文本向量拼接作为文本的向量表示,将文本向量作为CNN网络的输入进行文本分类.为验证所提模型的有效性,设置了与传统机器模型TF-IDF+SVM、单CNN、BLSTM神经网络模型及经典混合模型的对比试验.通过构造的交通运输信息标准条款数据集测试表明,基于改进的BLSTM和CNN的链式混合神经网络模型准确率达到93.77%.  相似文献   

5.
目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明:融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率.  相似文献   

6.
传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词向量表达;然后将文本向量输入到双向门控循环单元(BiGRU)中提取文本特征信息;最后将标签词与注意力机制结合,选出文本的倾向标签词,计算倾向标签词与文本向量的注意力得分,根据注意力得分更新文本向量。通过对比实验,本文模型比传统模型在文本分类任务中的准确率更高。使用XLNet作为词嵌入模型,在注意力计算时结合标签词能够提升模型的分类性能。  相似文献   

7.
基于词向量空间模型的中文文本分类方法   总被引:4,自引:0,他引:4  
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。  相似文献   

8.
应用特征聚合进行中文文本分类的改进KNN算法   总被引:14,自引:0,他引:14  
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 ,该算法明显提高了分类的准确率和召回率  相似文献   

9.
为进一步提高文本情感倾向性分类效果,提出基于文本特征和语言知识融合的卷积神经网络模型MI-CNN。使用Word2Vec表示词语信息,将词性和情感词语等语言知识嵌入词向量中,将文本特征和语言知识融合到情感倾向性分类模型,经过参数优化提升文本情感倾向性分类模型的准确率。在数据集上进行实验,结果表明所提出的模型准确率达到93.0%,比文献中的基准模型取得了更好的分类效果。  相似文献   

10.
研究了基于向量空间模型的自动文本分类方法,提出了位置权和词的位置区分度的概念,给出了一个带有位置信息的词权重计算方法,并给出了基于该方法的文本分类算法.实验结果表明,该方法是有效的,提高了文本分类的精度.  相似文献   

11.
基于SVM的分类方法综述   总被引:2,自引:0,他引:2  
本文介绍了文本分类的起源,常用的几类文本分类方法及基于SVM(Support Vector Machines)文本分类的基本原理和方法。并在分析文本分类的特点的基础上比较了在文本分类中应用SVM的优势及存在的问题。最后总结出了SVM在文本分类中应用的两个主要研究方向。  相似文献   

12.
《竹取物语》被认为是日本物语文学作品中最早的一篇,唐代传奇是中国唐代的文言短篇小说.从创作主题上将《竹取物语》与唐代传奇在人类的真实姿态——爱情与离别的悲伤、对人性的好奇以及对现实的世态批判与人性批评三个层面加以比较分析,挖掘潜藏在《竹取物语》文本深层的人性主题,探寻其中所蕴藏的中国唐代传奇元素,以及独特个性.  相似文献   

13.
首先,闻一多考辨唐诗与众不同,他从假设性的“叙录”做起,继而厘订诗人年谱,编辑诗人交流录及其著述目录,这既发展了年谱学,又将以上工作融入校正、辨析唐诗之中,为他最后撰写客观翔实、知人论世的唐代诗人评传奠定了基础。闻一多这种由假设和客观分析再到客观综合的整理思路贯穿于他的整个学术生涯。其次,同考辩唐诗,他又进入对唐人著述和唐史的研究:闻一多以目录治学,编制了《见存唐人著述目录》和《研究唐代用书目录举要》,一方面,两部书目各有特色,体例精当;另一方面,他以目录辨章学术、整理唐代文化史料尤富卓识,以上思路为中国文献学科的发展提供了一种新的思维方式,即闻一多所展现的创造性思维方式。  相似文献   

14.
杜甫诗歌的异文非常丰富.结合杜诗异文的校勘,分析其中所体现的农耕文明的烙印、所承载的社会文化的变迁、所折射的唐代的称谓文化以及佛教文化的影响,不难发现:杜诗异文中积淀着丰富的社会文化信息.  相似文献   

15.
意象思维是中国古代特有一种思维方式,无论是诗歌创作还是诗学评论,即通过意象来表达作者的情思。唐代司空图的《二十四诗品》无疑就是其中的美学典范,文本中有着大量的精炼性词组构成的密集意象群,以此来体现古典文人的诗歌创作论和诗歌批评论。同时由于司空图的妙笔生花,《诗品》集诗学与诗歌一体的文本特殊性,又分析了《诗品》意象下所隐含的精神内涵。  相似文献   

16.
对唐诗的研究传统多是针对其背景、主题思想、体裁以及艺术手法进行探究的。20世纪末,西方的后现代思潮引入我国,在学术界掀起了一股热潮,传统的一些文学作品和现象被重新定义,它们的论域在后现代语境下发生了重大的改变。作为古典文学旗帜的唐诗就在其中之列,后现代语境给了传统唐诗研究以活力,让它沿着反传统、反定式、多元化、通俗化、商品化的后现代方向不断发展。  相似文献   

17.
18.
瓷与诗是两种别具中国特质的文化产物,唐代长沙窑开创的器表题诗艺术形成了一种别具特色的“瓷诗文化”。这些诗歌大多不为唐诗典籍记录,属于民间原创作品,它们率真质朴地反映了唐代特定历史时期的市井生活和民生状态,为我们了解唐代民俗,研究诗史发展,特别是分析唐代民间诗歌文化提供了不可多得的鲜活实物资料。  相似文献   

19.
唐诗经典的基本属性是典范性和不确定性:典范性表现为能够代表某种范式的成熟,为后世创作提供借鉴;不确定性是由于审美思潮与价值标准会随着时代和个人而不断变化,并直接影响经典的建构。唐诗经典的形成主要取决于特殊的发现人,通过发现人而被广大读者所接受的。发现人对唐诗经典的标举是通过诗选、诗话、笔记和其他一些论诗杂著而实现的,其中诗选所建构的经典体系最为系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号