首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 213 毫秒
1.
微博情感倾向性分析通常指对中文微博中每个句子褒义、贬义或者中性的情感进行自动分类。针对微博碎片化和情感类别失衡的特点,在半监督学习reserved self-training方法的框架基础上提取了适用于微博情感分类的文本特征,并提出了针对情感倾向性分析通过训练度阈值设定的方法来优化reserved self-training迭代终止的条件,在保留reserved self-training能有效处理微博语料中语料情感不平衡问题的优点基础上,防止了训练过度情况的发生。COAE 2014微博情感倾向性评测结果证明了该方法的有效性。  相似文献   

2.
微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。  相似文献   

3.
情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。  相似文献   

4.
针对中文的语料,采用基于条件随机场的方法,在词、词性特征的基础上结合最近名词、句法依赖关系和句子倾向性等特征,分析不同特征对于评价对象抽取的影响.实验结果表明,结合了词、句子倾向性、词性、语法依赖关系、邻近名词等特征的条件随机场方法对于中文句子评价对象的抽取更有效.  相似文献   

5.
基于词向量的情感新词发现方法   总被引:1,自引:0,他引:1  
词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向,如何自动识别情感新词,并判断其情感倾向性已经成为当前亟待解决的问题。首先用基于统计量的方法识别微博语料中的新词,然后利用神经网络去训练语料中词语的词向量,从语料自身挖掘出词与词之间的相关性,最后提出了基于词向量的情感新词发现方法。实验表明该方法可以有效应用于情感新词发现。  相似文献   

6.
随着微博快速崛起,每天数以千万的人通过微博分享自己对各类话题的观点与情感,如何自动感知微博社区对特定话题的观点倾向性,已经成为中文微博计算亟待解决的问题。由于微博内容短小且不规范,传统的情感分析效率低下且效果很难满足实际需求。现提出一种将情感词典分类的方法进行实验研究,针对腾讯微博20个话题约17 500条微博32 000个句子的数据进行实验,实验结果表明提出的情感词典分类方法效果很好。  相似文献   

7.
商品评论是消费者针对某一个商品的主观议论。针对微博中商品的评论文本短小、结构多样等特征,在仅使用现有的微博级情感标注的条件下,提出了一种基于层叠条件随机场模型。以中文小句中枢说为理论基础,将商品评论的句子划分为若干小句,使用微博内小句序列的各种特征训练粗粒度的随机条件场情感分类模型,同时使用小句内汉字序列的各种特征来训练细粒度的随机条件场情感分类模型。实验结果表明,本文提出的方法优于传统的情感分类方法。  相似文献   

8.
针对微博的倾向性分析问题,提出了一种基于三元词组模式的情感分类方法。该方法通过构造情感词典及微博的三元词组模式,对未标注语料自动进行情感评分并标注情感极性,然后使用自动标注的语料训练得到情感分类器。在测试集上的实验结果表明,使用无人工参与标注的训练语料达到了79.26%的测试正确率。  相似文献   

9.
大数据时代下,微博作为一个开放性的信息传播平台吸引了众多的网民参与其中,与之相关的研究也得到了广泛的开展。本文将微博情感分析任务分为3步:微博语料的获取与预处理、情感特征的标注与选择、主观文本的情感分类。在主观文本分类中,将情感分类分为基于规则的方法和基于机器学习的方法。最后对当前中文微博的情感分析现状做了总结,并阐述了当前微博情感分类还需亟待解决的一些问题。  相似文献   

10.
研究第五届中文倾向性分析评测的任务3和任务4,即微博的倾向性分析和评价对象识别.网络新词多,句子格式不规范,语言简短且包含的情感内容多都是微博分析的难点.针对此问题,提出对中文微博的过滤算法.在词语倾向性识别中,构建基础观点词和网络观点词等词典,然后利用知网识别所有词语的倾向性.在评价对象的抽取方面,提出一种面向微博的基于统计和规则相结合的评价对象抽取方法,特别是提出利用句法分析和评价词、评价对象互信息的联合抽取算法.实验表明,该算法可以提升评价对象抽取的效果.  相似文献   

11.
中文微博命名体识别   总被引:1,自引:0,他引:1  
近年来微博的快速发展为命名体识别提供了新的载体,同时微博的特点也为命名体识别研究带来了挑战.针对微博特点,本文提出了基于拼音相似距离以及文本相似距离聚类算法对微博文本进行规范化,消除了微博的语言表达不规范造成的干扰.同时,本文还提出了篇章级、句子级以及词汇级三级粒度的特征提取,使用条件随机场模型进行训练数据,并识别命名体,采用由微博文本相似聚类获得的实体关系类对命名体类型进行修正.由于缺少大量的微博训练数据,本文采用半监督学习框架训练模型.通过对新浪微博数据的实验结果表明,本方法能够有效地提高微博中命名体识别的效果.  相似文献   

12.
本文对中文微博中主客观分类特征的选取进行了研究,通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征,对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,本文提出的方法能达到较好的分类效果。  相似文献   

13.
电火花沉积加工微细结构的研究   总被引:1,自引:0,他引:1  
论述了一种新的微细电火花加工方法.先确定微细电火花沉积加工工艺参数的选取原则,然后使用铜、钢和钨为电极,在空气介质中沉积出直径0.19 mm、高7.35 mm的微小圆柱体,又通过仅仅改变极性进行有选择性的去除加工.在此基础上提出单圆柱连续沉积策略,得到HIT字符型阵列.实验表明,重力对微细沉积加工的影响微弱,氩气介质有助于提高微圆柱体表面质量.最后的组织结构、能谱和硬度检测等显示,沉积材料致密、坚硬,并呈明显的分层结构.  相似文献   

14.
政务微博尤其是党政机构微博,作为危机情景下的传播工具,越来越多地参与到突发事件的信息传播中。以雅安地震为例,分析了相关党政机构微博在突发事件中的信息传播特点及模式。指出其在传播特点上表现为信息公开及时,重视追踪报道;把握报道的全局性,重视信息的选择性;以告知性信息和单向度的互动为主。在传播模式上,信息的单向流动、树状流动、放射状流动和复合式流动同时存在,并通过"粉丝路径"和"转发路径"共同构成了信息的多级传播模式。  相似文献   

15.
Smooth communication is essential for the success of construction projects. As an easy-to-use, context-rich, and high-capacity communication tool, blogging is gaining popularity in construction industry. In this paper, the features of blogging technology and how it could benefit construction organizations are presented. To further improve the effectiveness of blogging technology in information and knowledge sharing, an ontology-based semantic blogging system is proposed. Semantic blogging is an extension of conventional blogging and ontology is the key enabling technology for it. Domain-ontology-based semantic blogging site is composed of a network of concepts, which are clearly defined and interlinked according to their context and bound to certain behaviors. This paper reports how the e-Cognos ontology was implemented into a blogging system and how the system functions to process its contents. The paper concludes that using on-tology-based semantic blogging site can greatly enhance information sharing between construction professionals and it is a very promising tool for construction communities to publish and share their experience.  相似文献   

16.
基于细观弹性接触的多相颗粒材料本构模型   总被引:1,自引:0,他引:1  
在考虑了颗粒间细观弹性接触关系的基础上,使用微力学方法得到了随机堆积的多相颗粒材料非线性性本构模型的一般形式。为了说明模型的特点,本文给出了非线性弹性模型在静水压条件下和一维应变条件下的具体形式。模型清晰地反映出不同相颗粒间的接触对整体本构的贡献。与单轴粉末压实实验的对比表明模型预测与实验结果有比较好的一致性。  相似文献   

17.
基于Kinect的中国手语识别   总被引:2,自引:2,他引:0  
基于微软Kinect提取的深度图像信息,提出了一种新的中国手语识别方法。该方法首先利用Kinect获取人体主要骨骼的3D坐标和手的3D坐标;然后根据中国手语的手型、手的位置和手的方向3个主要构造成分,分别采用DBSCAN和K-means聚类算法获取手语特征中的手的位置基元和方向基元,提出一种结合CLTree和Attribute bagging聚类集成方法提取手型基元;最后将这3类基元进行组合采用模板匹配方法识别中国手语。通过对选取的72个中国手语进行识别实验,平均识别率为90.35%,实验结果说明了方法的可行性。  相似文献   

18.
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信息并提升文本分类效果,提出了一种结合词性信息的中文文本分类方法,其能够方便地从词语及其词性中学习隐式特征信息。利用开源数据并设计一系列对比实验用于验证方法的有效性。实验结果表明,结合词性信息的基于注意力机制的双向LSTM模型,在中文文本分类方面的分类效果优于常见的一些算法。因此识别文本的类别不仅与词语语义信息高度相关,而且与词语的词性信息有很大关系。  相似文献   

19.
阶跃式多元变参数振动钻削叠层复合材料的加工精度   总被引:3,自引:0,他引:3  
针对叠层复合材料的微小孔加工,提出了阶跃式多元变参数振动钻削新方法。在钻入、钻中、交互区和钻出的多区段钻削模型基础上,分析了产互区的分厚切削特性、自然分屑行性和多倍分离断屑特性。以入钻定位误差、孔扩量、出口毛刺高度作为钻削过程质量评价指标,进行了多元正交多项式回归优化试验。结果表明,阶跃式多元变参数振动粘销显著提高了孔的加工精度,是实现叠层复合材料微小孔加工的一种有效的优化加工方法。  相似文献   

20.
汽车磁流变减振器流变力学特性的研究   总被引:5,自引:1,他引:5  
磁流变液是一种新型的功能材料 ,属于可控流体 它能在强磁场作用下从牛顿流体变为有较高屈服应力的粘塑流体 ,这种变化连续可逆且迅速 ,用其制成的阻尼器具有结构简单、体积小、能耗低和阻尼可连续调节等优点 利用非牛顿粘性流体模型和宾汉流体模型 ,设计基于流动模式的汽车用磁流变减振器 ,利用ANSYS有限元分析软件计算其力学性能并进行试验验证 结果表明磁流变减振器可实现阻尼无级可调 ,将其用于汽车悬架系统 ,可改善行驶的平顺性 ,获得良好的振动特性  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号