首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
针对评价对象存在领域相关性这一特点,在条件随机场模型中结合领域词词典特征进行中文句子评价对象的抽取,然后利用领域规则对抽取结果进行处理.针对COAE2011任务三标注语料的抽取实验结果表明,结合领域词词典和领域规则对于利用线性链、跳跃链和层叠条件随机场模型的中文句子评价对象抽取方法可以有效地提高抽取的精度,并抽取出更多的评价对象.  相似文献   

2.
针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升.  相似文献   

3.
根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。  相似文献   

4.
中文句子倾向性分析   总被引:1,自引:0,他引:1       下载免费PDF全文
针对句子的倾向性进行判断,采用SentiWordNet构建中文倾向性词表,通过剔除停用词等降低句子向量的维数,以此来提高句子向量化速度,然后利用支持向量机分类器进行句子倾向性判断,最后提出两种新的置信度计量方法对倾向性句子进行排序.实验结果表明,构建的识别系统在一定程度上能有效识别倾向性句子.  相似文献   

5.
鲁琳  朱艳辉  杜锐  邓程  梁韬 《科学技术与工程》2014,14(12):229-232,261
微博作为当前互联网信息快速传播与分享的新平台,具有信息量庞大、评论多样等特点。针对微博评论信息中的评价对象抽取,采用组块分析和词语位置特征对训练集中3 000条微博观点句的评价对象序列标注,利用条件随机场学习并识别评价对象的名称、属性及其他辅助信息,通过修改相关参数达到最优识别效果,并提出针对复杂观点句评价对象的提取算法。实验结果表明,对测试集中7 000条微博观点句进行评价对象的名称和属性的抽取,效果较好。  相似文献   

6.
基于非负矩阵分解的中文倾向性句子识别   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于非负矩阵分解(NMF、SNMF和WNMF)的中文倾向性句子识别算法.该算法首先构建倾向性特征矩阵,然后通过NMF、SNMF和WNMF算法分别来降维、提取潜在语义,最后采用支持向量机分类器识别中文倾向性句子.实验结果表明,与PCA和SVD相比,NMF、SNMF和WNMF算法能有效地降低维度、提取潜在语义,并提...  相似文献   

7.
提出一种结合AB-SMOTE和C-SVM的中文倾向性句子识别算法.该算法先利用AB-SMOTE方法合成新样本,降低不平衡程度的同时也使数据具有更好的代表性,再对不同类别赋予不同的惩罚系数形成代价敏感的C-SVM分类器,充分结合了数据层和学习算法层方法的优点.实验结果表明,对酒店、笔记本电脑和书籍3个不平衡语料处理时,本算法能较有效解决不平衡问题,提高倾向性句子的识别精度.  相似文献   

8.
提出了基于条件随机场(conditional random fields,CRF)的网页动态关系抽取算法.给出了动态关系的定义,建立了动态关系的表示模型,并用一个六维结构来表达动态关系.与传统关系抽取中基于规则或者基于分类的解决方法不同,本文认为可以将动态关系识别问题转化为一个标注问题,并提出了基于CRF的句子层面的关系标注和抽取方法.在本算法中,首先将一个句子通过语义角色标注(semantic role labeling,SRL)系统进行成分识别,然后将语义角色标注结果以及词的POS类型、词组的命名实体类型等作为CRF的训练特征,对句子成分进行标注.最后测试了大量的真实新闻网页,实验结果表明了本文提出算法的实用性和有效性.  相似文献   

9.
利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题.为了解决这一难题,设计了一种六字位标记集,提出了一种基于层叠式条件随机场模型的古文断句与句读标记方法.基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记.实验在5 M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%.  相似文献   

10.
基于条件随机场的中文科研论文信息抽取   总被引:1,自引:1,他引:1  
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型参数估计和特征选择.实验中采用L-BFGS算法学习模型参数,并选择局部、版面、词典和状态转移4类特征作为模型特征集.在信息抽取时先利用分隔符、特定标识符等格式信息对文本进行分块,在分块基础上用条件随机场进行指定域的抽取.实验表明,该方法抽取性能明显优于基于隐马尔可夫模型的方法,且加入不同的特征集对抽取性能提升作用不同.  相似文献   

11.
With the development of modern industry, sheet-metal parts in mass production have been widely applied in mechanical, communication, electronics, and light industries in recent decades; but the advances in sheet-metal part design and manufacturing remain too slow compared with the increasing importance of sheet-metal parts in modern industry. This paper proposes a method for automatically extracting features from an arbitrary solid model of sheet-metal parts; whose characteristics are used for classification and graph-based representation of the sheet-metal features to extract the features embodied in a sheet-metal part. The extracting feature process can be divided for valid checking of the model geometry, feature matching, and feature relationship. Since the extracted features include abundant geometry and engineering information, they will be effective for downstream application such as feature rebuilding and stamping process planning.  相似文献   

12.
英语长句结构复杂,我们在做英译汉时,应采用顺译、变序、拆句和重组等方法,按照汉语的表达习惯理顺原,重新安排句子的顺序。  相似文献   

13.
省略是广告语篇的主要特征之一,它符合信息有效编码原则、语言的经济原则、合作原则以及交际本身的要求。广告语篇中省略的使用既拉近了广告商与消费者之间的距离,又突出了广告所要传达的主要信息。  相似文献   

14.
该文主要研究双音节句在不同焦点、语气下的表现。目的是为了考察汉语双音节组合的调形模式是否以及如何受到语调影响。实验设计了16组双音节目标句,每组包含宽、前、后3种焦点和陈述、疑问两种语气。实验结果描述出16个双音节组合中前焦和后焦的聚焦模式,其中包括含有上声的组合。实验发现,在聚焦手段中,前后音节的高音点差值在16个组合中都起到了区分焦点的作用,并再次证明汉语语调存在稳定的"二字组基本单元";双音节句的疑问语气信息由高音点的位置决定,疑问与陈述语气的差异突出表现为疑问语气的高音点更高。  相似文献   

15.
中古汉语让步复句探析   总被引:1,自引:0,他引:1  
孟凯 《长春大学学报》2004,14(1):40-44,51
基于对中古汉语典型语料中让步复句的考察,辅以符号化的形式,通过列表对让步复句在句式和关联词语两方面的情况进行较为系统、全面的描写与阐释。句式方面着重分析基本句式的四种变式所占的比例、强弱势发展,以及紧缩句的大体状况,并对它们的成因进行扼要解释;关联词语方面主要阐述单音连词、复音连词、关联副词、关联词语前后搭配和关联词语与主语的位置等几个问题。  相似文献   

16.
格的语法是费尔摩(Fittmor)在其论文《格之格》(1968年)提出来的,是生成语义学的一个重要部分·本文全面地介绍了格语法的理论及其应用,并进一步指出了其重要性及其存在问题  相似文献   

17.
提出一种基于统计机器翻译的思想抽取评价对象与评价词的方法。该方法利用词对齐模型抽取评价对象与评价词之间的关系,并结合词共现信息等特征来估计两者关系的强度。建立一张二分图刻画评价关系,并加入领域相关性度量,利用随机游走算法迭代计算候选评价对象与评价词的置信度。在COAE2011任务3的语料上进行试验验证。结果表明,利用词对齐模型抽取评价对象与评价词可以有效提高准确度,抽取出更多的评价对象与评价词。  相似文献   

18.
不同超声强度对提取大黄蒽醌成分的影响   总被引:1,自引:0,他引:1  
不同超声强度对提取大黄蒽醌成分的影响郭孝武,张福成,林书玉,员维俭(陕西师范大学应用声学研究所,西安710062,第一作者,男,53岁,gIJ教授)大黄是临床常用中药,不仅有致泻、解毒之作用,而且有很强的抗菌效果.目前研究表明,大黄中主要是滴配类成分...  相似文献   

19.
对英语松散句和掉尾句从定义、类型及修辞特点等方面进行了比较,探讨了其相互间的转换以及各自的语篇功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号