首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对影评数据的情感分析,提出基于Word2vec和多分类器的情感分类方法.首先在对评论数据进行预处理的基础上,训练Word2vec模型,将词表示为词向量;其次结合随机森林和朴素贝叶斯多项式模型完成影评数据的情感分类;最后在Kaggle竞赛公开的影评数据集上进行实验.结果表明,Word2vec可有效捕捉词的语义,显著提高情感分类算法的性能.  相似文献   

2.
提出了一种基于TF-IDF的均值Word2vec模型和有监督的机器学习方法的燃气客服热线的中文文本情感分析方法。首先,采用Word2vec模型训练出文本中每个词语的词向量及TF-IDF算法计算文本中每个词语的权重,并对词语的词向量进行加权处理。其次,将加权后的词向量对应维度的值进行累加并求均值作为该文本的向量,即文本的特征。最后,对文本的特征使用有监督的机器学习方法进行训练和预测,以实现文本的情感分析。实验结果表明,该方法获得了较高的分类准确率并能有效地进行情感分析。  相似文献   

3.
单词向量化是自然语言处理领域中的重要研究课题之一,其核心是对文本中的单词建模,用一个较低维的向量来表征每个单词.生成词向量的方式有很多,目前性能最佳的是基于神经网络语言模型生成的分布式词向量,Google公司在2012年推出的Word2vec开源工具就是其中之一.分布式词向量已被应用于聚类、命名实体识别、词性分析等自然语言处理任务中,它的性能依赖于神经网络语言模型本身的性能,并与语言模型处理的具体任务有关.本文从三个方面介绍基于神经网络的分布式词向量,包括:经典神经网络语言模型的构建方法;对语言模型中存在的多分类问题的优化方法;如何利用辅助结构训练词向量.  相似文献   

4.
本文以青海花儿唱词为研究对象,采用朴素贝叶斯机器学习模型和长短期记忆网络(LSTM)机器学习模型对其建模.首先对青海花儿唱词进行收集,建立模型并对收集到的唱词进行特殊的预处理操作,利用Word2vec生成词向量模型,构建二种不同的机器学习算法模型:朴素贝叶斯模型和LSTM神经网络+Word2vec模型;其次划分花儿唱词...  相似文献   

5.
针对电气工程领域英汉机器翻译中平行语料稀缺的问题,在使用通用语料训练翻译模型的基础上,提出了一种融合领域术语信息的嵌入层参数初始化方法.首先,对文本进行分词预处理,将术语词划分为一个最小单元;然后,利用Glove和Word2vec在不同单语语料上训练得到两种词向量,并分别初始化嵌入层参数中常用词和术语词的向量表示;最后...  相似文献   

6.
针对Word2vec等静态词向量模型不能解决一词多义、传统情感分析模型不能同时提取文本的全局和局部信息问题,本文提出了结合广义自回归预训练语言模型(XLNet)的文本情感分析模型。首先利用XLNet表示文本特征,然后利用卷积神经网络提取文本向量的局部特征,再利用双向门控循环单元提取文本的更深层次上下文信息,最后引入注意力机制,根据特征的重要性赋予特征不同的权重,并进行文本情感极性分析。仿真实验中将本文模型与5种常用的情感分析模型进行对比,验证了模型的准确率和优越性。  相似文献   

7.
针对传统文本分类方法忽略词语间的语义特征的问题,并为了改善输入文本的表示质量,提出一种基于短语结构和词语词性相结合的情感分类方法.该方法首先通过短语结构优化分词,可以更好地提取文本特征;其次利用Word2vec工具训练词语和词性相结合的文本语料库得到词向量模型,解决了Word2vec无法识别一词多义的问题;最后通过SVM算法对文本进行情感分类.实验结果表明,该算法能够提高文本情感分类的正确性.该方法对舆情监控、股票市场行情预测和了解消费者对产品的偏好等具有较高的实用性.  相似文献   

8.
文章用GOOGLE开源的Word2Vec工具把藏文文本《贤者喜宴》经过分词后的语料作为输入,将文本中的词映射到一个K维空间,利用词汇的上下文信息将词转变为词向量.Word2Vec工具再通过学习得到一个向量模型,每一个词都用一个独特的词向量来表示.训练文本数据构造一个词表,然后学习词的向量表示.词向量能够捕获许多语言的规律,从而得出词与词之间的距离即相似度.进一步通过高频词汇作为输入,通过训练即可输出与高频词汇距离最近的词汇,以高频词和与其相近的词汇作为重要信息去预测文本的大致语义.实验结果表明基于Word2Vec训练模型的准确率和召回率都很高.  相似文献   

9.
基于word2vec和BERT词向量技术的方法在文本分类分词过程中存在着错误传播问题,提出了融合ERNIE词向量技术的卷积神经网络模型.针对中文文本,运用ERNIE实体掩码的方式捕获词汇和语义信息,使用卷积神经网络进行特征提取.在THUCNews开源数据集上,准确率达到93.95%,比Word2Vec-CNN高出3.4%,BERT-CNN高出3.07%.实验结果证明了本文模型在缓解错误传播问题的有效性.  相似文献   

10.
针对微博谣言带标签数据不足,且当下的谣言检测模型无法持续学习应对不断变化的微博网络语言等问题,本文提出BERT-BiLSTM-LML微博谣言持续检测模型.首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取两个任务输入文本数据的词向量;其次,使用双向长短时记忆(Bi-directional Long Short-Term Memory, BiLSTM)网络充分提取文本的上下文特征;最后,基于BiLSTM深层特征使用终身监督学习算法ELLA(Efficient Lifelong Learning Algorithm)对两个任务的特征数据进行建模,以实现对微博谣言的持续检测.实验结果表明:BERT词向量有效优化了模型性能,比基于Word2vec词向量的Word2vec-BiLSTM-LML模型在准确率和F1值都提升了5.5%.相较于独立学习,在持续学习争议检测任务后,模型的谣言检测准确率提升了1.7%,F1值提升了1.8%.同时,在持续学习过程中,随着知识的积累,谣言检测准确率持续提升.最终在公开...  相似文献   

11.
研究了国家法的抽象正义观与民间法的情理正义观,认为西方国家法的抽象正义观与东方民间法的情理正义观存在实质的不同,原因在于思维方式、超验与经验传统、政治结构的差别。在现代法治理念下,传统民间法所代表的正义观将向混合正义观转型,西方法治所代表的国家法抽象正义观是其骨架。  相似文献   

12.
图集的统一协调,对图集质量有很大影响。本文是作者在编制北京市农业区划地图集的实践基础上,根据地图信息传输论的观点,对农业区划地图集的统一协调的内容及方法进行了探讨。试图总结编制这类图集的统一协调模式,以供读者编图时参考。  相似文献   

13.
利用对位异构体的对称性由核磁共振氢谱测定了工业十二烷基苯在硝硫混酸中的硝化选择性,发现一硝化产物中对位异构体的比例为75% ̄80%。以月桂酸和苯为原料,经氯化、酰化和还原合成了正十二烷基苯。在同样条件下研究了正十二烷基苯的硝化,由核磁共振氢谱和气相色谱分析,发现一硝化产物中对位异构体的比例仅为60%。根据空间位阻效应,对结果进行了讨论,并与甲苯,乙苯,异丙苯等短链烷基苯的硝化结果进行了比较。  相似文献   

14.
YBCO掺杂效应研究   总被引:3,自引:0,他引:3  
介绍了YBCO掺杂的基础知识,总结了YBCO各个位置采用典型元素掺杂而导致的超导电性和结构的变化,阐述了掺杂对YBCO的重要影响,并简介了当前YBCO掺杂效应研究中的几个热点问题.  相似文献   

15.
为了找出诱发高频机组基础不良振动的原因,从基础计算模型方面对基础激励与响应进行了分析,以两个高频机组基础为动测实例,经模态分析得出钢筋混凝土构架式基础竖向1阶振动与电机产生共振;应用功率谱法对动力机组及基础平台进行动测,得出平台异常响应频率66Hz为水泵工作频率,调整机器的工作频率可避开不良振源影响,达到明显的减振效果。由此而知,动力机器基础出现不良振动时,不可盲目改变结构的动力特性,应在机器不同工况比如:停机、起机及正常转速下,对机器及基础进行动测并对振动信号进行比较分析,以制定出行之有效的减振方法。  相似文献   

16.
给出整数幂的和的另一种计算公式的方法.  相似文献   

17.
给出了一维非自治时滞系统点态退化的一个例子,拓宽了该领域的研究。  相似文献   

18.
曲面“侧”是一个重要而难以理解的概念 ,本文对曲面“侧”概念的讲授方法进行了探讨 ,给出了曲面“侧”概念的“参照物”理解法 ,通过实践证明 ,效果良好。  相似文献   

19.
宏观收入量的分配不仅反映一个国家总体消费的基础水平,而且影响到各阶层消费水平及消费方式.虽然一个国家的宏观收入量的分配不可能绝对平等,但是不等性的大小往往影响到社会和经济的发展,影响到社会的稳定.本文采用洛伦茨曲线、基尼系数来描述宏观收入的不等性,并结合实际情况对我国宏观收入的不等性进行了具体的分析.  相似文献   

20.
老年人生活空间移动性影响要素研究进展   总被引:1,自引:0,他引:1  
 老年人生活空间移动性是老年人在日常生活中能动生活状态的重要表征。在梳理老年人生活空间移动性相关概念、测度方法基础上,分析了物质环境要素和非物质环境要素对老年人生活空间移动性的影响;提炼出有效支持老年人生活空间移动性的中观环境规划、微观环境设计和政策文化扶助层面的策略;指出了老年人生活空间移动性的研究建议和发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号