期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑惠中左万利《吉林大学学报(理学版)》2016,54(3):561-568

针对社交网络用户人格预测问题, 提出一种结合信息增益与语义特征提炼用户文本信息, 并采用多标签分类算法进行综合预测的方法. 先基于信息增益提取文本词特征, 包括情感词、词性和时态等, 进行特征选择与加权; 对于语义特征, 将文本内容映射为本体概念并计算语义相关度; 然后以基于词的特征和语义特征的共同
影响为依据, 运用多标签分类算法执行人格预测过程, 从不同角度处理文本信息, 并充分考虑了类标签间的相关性. 实验结果验证了该方法的有效性. 相似文献

2.

网络文本分类中基于信息瓶颈的特征提取 总被引：3，自引：0，他引：3

贺一帆江铭虎《清华大学学报(自然科学版)》2010,(1)

针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分类特征。在网络文本语料上的分类实验显示,该方法保留了基于概念特征提取方法的鲁棒性强、特征维数低的优点,但克服了概念词典中新词无定义,需要维护更新词典的不足。相似文献

3.

基于改进的向量空间模型的自动文本分类

任美睿郭龙江李金宝《哈尔滨商业大学学报(自然科学版)》2006,22(1):77-80

研究了基于向量空间模型的自动文本分类方法,提出了位置权和词的位置区分度的概念,给出了一个带有位置信息的词权重计算方法,并给出了基于该方法的文本分类算法.实验结果表明,该方法是有效的,提高了文本分类的精度. 相似文献

4.

基于词-标签概率的多标签文本分类研究

赵宏郑厚泽郭岚《兰州理工大学学报》2023,49(1):103

针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM (bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值. 相似文献

5.

基于局部特征和全局特征融合的微博情感分析

胥桂仙陈思瑾孟月婷张廷于绍娜《中南民族大学学报(自然科学版)》2023,(4):526-534

目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明：融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率. 相似文献

6.

基于语义共现与注意力网络的问题分类方法

楼姣马伟锋季曹婷马来宾《浙江科技学院学报》2020,32(4):264-271

针对汽车故障问答文本特征稀疏、语义信息不全、深层次语义特征较难提取等问题,提出基于问题-答案语义共现的多层次注意力卷积长短时记忆网络模型(co-occurrence word attention convolution LSTM neural network,CACL)的问题分类方法。通过向量空间模型计算问题与答案文本中语义相似的共现词,使用注意力机制聚焦问题文本中的共现词特征,输入卷积神经网络(convolutional neural network,CNN)提取问题局部特征,通过长短时记忆网络(long short-term memory network,LSTM)及词级别注意力机制提取长距离依赖特征及其更高层次的文本特征,采用Softmax进行问题分类。结果表明,相比较于主流的问题分类方法,该方法有效提高了问题分类的精度,最高提升了10.04%的准确率。同时,试验发现当选用11个有效共现词且共现词来自问题文本时,模型的处理精度最佳。合理利用问题-答案文本语义相似的共现词,能有效提升汽车故障问题的分类性能,且共现词的个数、来源对问题的分类精度有一定的影响。相似文献

7.

基于概念网的智能信息服务系统的设计与实现 总被引：1，自引：0，他引：1

罗三定曾亮《南华大学学报(自然科学版)》2004,18(1):44-48

针对如何组织、管理与有效获取信息问题,介绍了一个基于概念网的集信息收集、检索与管理的智能信息服务系统设计与实现.依靠概念网,采用文本类别特征提取及文本匹配和概念角色提取算法完成待收录文档的自动分类组织,利用概念检相似文献

8.

基于特征融合的中文文本情感分析方法

赵宏傅兆阳王乐《兰州理工大学学报》2022,48(3):94

针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率. 相似文献

9.

基于XLNet+BiGRU+Att(Label)的文本分类模型

下载免费PDF全文

刘柏霆管卫利李陶深《广西科学院学报》2022,38(4):412-419

传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词向量表达;然后将文本向量输入到双向门控循环单元(BiGRU)中提取文本特征信息;最后将标签词与注意力机制结合,选出文本的倾向标签词,计算倾向标签词与文本向量的注意力得分,根据注意力得分更新文本向量。通过对比实验,本文模型比传统模型在文本分类任务中的准确率更高。使用XLNet作为词嵌入模型,在注意力计算时结合标签词能够提升模型的分类性能。相似文献

10.

施工组织设计文档智慧辅助审查中的文本分类问题研究

郭潇楠王仁超毛三军彭相国《科学技术与工程》2022,22(36):16180-16188

施工组织设计是指导工程建设全过程活动的技术、经济和组织的综合性文件,随着自然语言处理(NLP)等人工智能技术的发展,本文针对施工组织设计文档智慧辅助审查中基础性工作之一-文本分类问题开展研究。为实现施工组织设计文本的自动分类,本文运用Word2vec词嵌入技术对文本进行向量化表示,基于Bi-LSTM捕捉文本上下文序列信息,融入Attention机制,提取文本有效信息,采用softmax激活函数分类。Attention Bi-LSTM在房建数据集上达到了0.97的准确率、召回率以及F1值,整体分类效果在正确率、宏平均、加权平均上均优于其他模型。融入Attention机制的Bi-LSTM文本分类模型通过双向捕获文本的特征并利用Attention机制提取有效信息,达到了联合优化的作用,提高了模型的分类性能。相似文献

11.

面向文本分类的深度置信网络特征提取方法研究

易军凯王超李辉《北京化工大学学报(自然科学版)》2018,45(3):90-94

在对文本分类领域发展现状进行研究的基础上,提出了一种面向文本分类的深度置信网络特征提取方法,通过引入词向量模型和深度置信网络解决传统文本分类方法在文本表示及特征提取方面存在的语义缺失问题,实验结果表明,该方法在文本分类中有更高的准确率。相似文献

12.

基于规范文本的特征词提取技术研究

孙翔潘廷勇李祥秋赵永超崔曙光《太原科技》2012,(3):61-63

文本特征词提取是一种提炼文本重要信息的实用技术,同时也为文本聚类、自动分类、信息抽取等相关课题提供了技术支持。在规范文本上,利用文本篇章结构的特征,以此为基础设计了一个特征词的加权函数,综合考虑了词频、词长和位置因子,并对比分析了各种位置因子对系统的贡献度。相似文献

13.

基于机器学习的Web文本分类技术及算法

金春霞周海岩《吉林工学院学报》2009,30(3):347-351

提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类。相似文献

14.

基于词条聚合和决策树的文本分类方法

王煜张明马力《河北大学学报(自然科学版)》2005,25(3):338-342

根据词条聚合和决策树原理,提出了一种文本分类的新方法.决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间.本方法将与各个类别相关程度相似的词条聚合为一个特征,有效地降低了向量空间的维数,然后再使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取分类规则的优势. 相似文献

15.

结合优化文档频和变精度粗糙集的特征选择方法 总被引：1，自引：0，他引：1

朱颢东钟勇《河南大学学报(自然科学版)》2009,39(5)

在文本分类中,特征空间的维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象.为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法.首先给出了一个基于最小词频的文档频方法,然后把变精度粗糙集引入进来并提出了一个基于信息熵的属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择算法.该综合算法首先利用基于最小词频的文档频方法进行特征选择,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法比最好的3种经典特征选择方法"互信息"和"统计量"以及文档频都要好. 相似文献

16.

一种新颖的特征提取方法在文本分类器中的应用

许建明杨磊黄同成《邵阳学院学报(自然科学版)》2008,5(1):37-39

自动文本分类中类别特征提取是文本分类中的关键,传统特征提取算法存在特征提取不够准确,进而导致分类精度不高．为解决此问题,本文提出了一种有效的特征提取方法一基于滑动窗口的特征提取方法,用来构成文本分类的模型,该方法能扩大特征的提取范围．实验表明,改进后的分类模型可以有效地提高文本的分类精度。相似文献

17.

基于贝叶斯粗糙集的文本特征选择方法 总被引：3，自引：1，他引：2

朱颢东钟勇《河南师范大学学报(自然科学版)》2009,37(4)

特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的. 相似文献

18.

基于模糊聚类的学术期刊数据挖掘算法

孟海涛《盐城工学院学报(自然科学版)》2006,19(4):68-70

提出了一种新的文档特征提取方法，将关键字通过文档的题名、摘要进行映射扩展，并对关键字的出现位置进行加权，不仅解决了维度偏高的问题，而且突出了重点特征词，提高了聚类的速度和精度。相似文献

19.

The time course of visual categorization： Electrophysiological evidence from ERP

CHEN Antao LI Hong QIU Jiang LUO Yuejia 《科学通报(英文版)》2006,51(13):1586-1592

Categorization is the process to ascertain the identity of an object by a specific standard[1,2]. Categorization isa fundamental cognitive process; in fact, the raw per- ception would be of little use without the effective clas- sification of original inf… 相似文献