首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于条件随机场的汽车领域术语抽取   总被引:1,自引:0,他引:1  
中文领域术语抽取是中文信息处理领域的一项重要研究任务,在词典构建、领域本体构造等方面有重要的应用.采用条件随机场(conditional random fields,CRFs),从汽车知识网站上爬取网页,预处理后得到纯文本,然后分析汽车领域的术语组成特点并制定相应的语料标注规则进行人工标注,对汽车领域进行了术语抽取.在使用词和词性特征的基础上增加了词典特征、领域词频和背景领域词频等特征,精确率、召回率和F-值分别达到84.61%、80.50%和82.50%.与其他方法比较说明所提出的汽车领域术语抽取方法是有效的.  相似文献   

2.
双语术语自动抽取是自然语言处理领域的重要研究课题之一,对于跨语言检索、机器翻译,以及双语词典的构建等具有重要意义。该文提出了一种面向中英平行专利语料的无监督双语术语自动抽取算法。该算法利用基于短语的统计机器翻译模型中的短语对齐和基于条件随机场的组块分析,实现双语术语自动抽取,同时借助专利语料的领域主题信息进一步提高双语术语抽取的准确率。实验表明:该算法在5 867组电通信技术领域的中英平行专利文档上进行双语术语的自动抽取,准确率达到94.00%。  相似文献   

3.
针对电气工程领域英汉机器翻译中平行语料稀缺的问题,在使用通用语料训练翻译模型的基础上,提出了一种融合领域术语信息的嵌入层参数初始化方法.首先,对文本进行分词预处理,将术语词划分为一个最小单元;然后,利用Glove和Word2vec在不同单语语料上训练得到两种词向量,并分别初始化嵌入层参数中常用词和术语词的向量表示;最后...  相似文献   

4.
首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介, 借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先, 借助互联网中已有的人工分类领域URL, 根据URL-Key在各领域汇总使用的频度, 采用基于方差的领域URL-Key识别方法, 构建领域URL-Key词表; 然后, 利用伪反馈技术, 收集候选领域词检索得到的URL结果集, 根据URL结果集构建候选领域术语的URL-Key特征向量; 最后, 利用SVM对候选领域术语进行提取。在4个领域进行实验, 都取得不错的效果。新提出的方法可以有效地解决低频术语识别问题, 为低频术语的识别提供新的思路。  相似文献   

5.
提出一种基于词频-极性强度值的情感词挖掘方法构建中文抑郁症情感词典。首先,对抑郁症患者评论语料进行有效分词,采用双向最大匹配和互信息方法选出候选情感词,再通过计算词频-极性强度值得到种子词集;然后,通过计算基础中文情感词典与种子词的语义相似度,得到抑郁症领域情感词表,将词表与种子词集合并,得到中文抑郁症情感词典。结果表明:本文提出的方法可准确地挖掘抑郁症专有领域情感词。  相似文献   

6.
由于法律领域知识图谱专业性强、结构复杂,而现有的关系抽取方法因各个领域的需求和术语不同,无法适用于法律领域知识图谱的构建和补全.首先,提出了基于StanfordNLP关系抽取机制的法律知识图谱构建方法;然后,构建基于设置谓语导向词的深度学习模型对法律知识图谱进行补全;最后,选用典型案例(伪卡盗刷判决书)作为文本对象验证...  相似文献   

7.
针对一个术语的多条候选定义, 首次提出术语定义辨析模型并给出一种基于互联网的求解方法。该方法从百度百科和百度搜索构建参考释义, 总结术语及其定义来源语料中的术语定义模板, 根据参考释义和定义的模板从待辨析定义中选出最优定义。实验选取中国知网概念知识元库中部分领域的术语在学术文献和工 具书中的定义作为待辨析对象, 用所提出的模型和方法进行辨析实验, 结果表明, 该方法辨析的准确率为96.1%, 有很好的辨析效果。  相似文献   

8.
为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为27.28%;实验结果表明,新方法更需要大量平行语料支持,但是两种方法都有助于提高汉维医学领域机器翻译质量,使提取和翻译大量医学术语自动化.  相似文献   

9.
基于语言特性的中文领域术语抽取算法   总被引:2,自引:0,他引:2  
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.  相似文献   

10.
一种基于极性词典的情感分析方法   总被引:1,自引:0,他引:1  
极性词典是文本情感分析和倾向性分析的基础。本文构建了一个全面、高效的极性词典,包括基础词典、领域词典、网络词词典以及修饰词词典,深入研究了修饰词对极性词的影响,将极性词与修饰词组合成极性短语作为极性计算的基本单元,提出了一种基于极性词典的情感分析方法。实验结果表明,利用本文构建的词典进行倾向性分析效果不错。  相似文献   

11.
对与晶体中3d或4f离子晶场光谱热移位相对应的光谱谱线(锐线)的热加宽进行了研究,在原有的声频支的Raman项、单声子项贡献的基础上,进一步考虑了光频支项的贡献,推导出晶体中离子能级热宽度的计算公式.  相似文献   

12.
对蒙古语的术语原则、术语翻译、术语国际化、术语研究等方面存在的问题进行分析,认为群众性原则以及“挖、创、借”原则有不妥之处,指出应当依据国际标准以及国家颁布的术语确立原则,运用蒙古语言文字的规律,采用外来语、使用前缀等方法,繁荣和发展蒙古语术语.  相似文献   

13.
极限运算与求导运算可以交换的一个充分条件   总被引:2,自引:2,他引:0  
利用等度可导的概念代替较强的函数列的导函数是一致收敛的条件,得到了极限运算与求导运算可以交换的一个充分条件。  相似文献   

14.
以学科教材术语语料库建设为目标,实现了一种基于底表的多层扫描术语自动标注算法.该算法首先采用预测性规则模板扫描文本中未登录术语,并进行标注;其次采用最大匹配方法识别出每个可能的候选术语,把每个候选术语看作术语的定位点,扫描其上下文语境,分别调用单位术语规则模板、例外规则、部件规则、部件例外规则、例外校正规则等对扫描结果进行判断,确定候选术语的身份,并进行标注.该方法以规则的预测和限定功能为辅,充分利用了底表术语信息,取得了较高的标注准确率和召回率,开放测试F-指数达到了84%左右.  相似文献   

15.
得到了人造月球卫星在月球、地球和太阳引力作用下的运动:1)除轨道根数a,e,i外都有长期项;2)所有根数都有短周期变化,但是变化周期很短,振幅很小;3)除轨道半长径a以外都有长周期项。长周期项可以分为3部分:第一部分是由于月球扁率摄动造成的;第二部分是由于地球引力造成的;第三部分是二者联合摄动造成的。其中以第二种影响最大;它的周期约半个恒星月,振幅约3km和3ms~(-1)。还讨论了人造月球卫星以及相应的同步卫星的运动稳定性。  相似文献   

16.
徒手体操术语与定位法舞谱作为描述形体动作的工具,它们在理论体系上是不同的,本文通过比较,总结了构成它们各自理论体系的基本原理、描述依据与构成因素等,并指出二者在运用时的准确性、简炼性、易懂性的差异.  相似文献   

17.
本文讨论了有限区间上广义可积函数列与极限是否可交换的问题,并给出了有限区间上可积函数列可逐项积分的一些条件。  相似文献   

18.
在实际生产中,通常公司会有一些长期客户的存在,这些长期客户通常表现为协议价格,这些长期客户通常可以避免销售情况的大起大落,虽然协议销售需求稳定,但是通常价格较低。协议销售数量过多,必然会影响企业总体收益,如果过低,则会使需求不稳定,承担较大的风险。为了合理确定协议销售和自由销售之间的关系,本文建立了协议销售与自由销售的收益管理模型,讨论了模型的性质,并给出了算例分析。  相似文献   

19.
根据点群作用下谱项波函数与单电子波函数具有相同变换性质的特点推引配位场谱项.  相似文献   

20.
本文介绍了由APPLE—Ⅱ微机、程序控制磁盘及反应台3部分组成的,用于进行记忆品质参数测试的一套实验装置,来代替过去的人工或机械的测试方式,以提高测试时的精度和结果的准确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号