首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
文章简要介绍了自动术语提取任务的定义、主要方法和评价指标。针对传统的自动术语提取方法,以互信息、t值、tf-idf、C/NC-value为例介绍了单元度和术语度的概念;针对自动术语标注方法,主要介绍了基于序列标注的建模思想。从提取效果来看,现有自动术语提取技术距离期望仍有差距,文章也尝试给出了一些值得探索的方向。  相似文献   

2.
双语平行语料库的数据资源建设是语言工程的前端。其中包含大量的术语及语言翻译知识。深入研究和开发双语语料库,对术语翻译具有重要意义。文章论述了平行语料库的深加工流程和中文语料标注的自动化加工。使用“语法符号语言”建立文本的语法映像,生成短语组块库。按短语结构规则采用人工智能方法自动抽取术语翻译组块,自动生成术语组块词典与词表,列出部分术语组块查询应用的实例和逆向追踪双语例句的实例。  相似文献   

3.
公司跨国经营离不开翻译,翻译质量和速度是获取目标市场份额的关键因素。积极主动地管理术语,包括预处理翻译项目中的关键术语,会产生积极影响。在商业环境中,翻译内容包罗万象,术语来源广泛。以术语提取为基础,采取重用已有词汇的后处理策略,可最大限度提高效率,把术语自动整合到翻译管道中。从语料库中提取用于翻译的术语,导入术语库,用于商业开发。根据工作经验,作者探讨了术语提取的有效方法。  相似文献   

4.
略谈术语学研究   总被引:3,自引:0,他引:3  
本文对术语学的定义和体系提出了建议,推荐了需要开展的重要研究课题,如:术语命名的理论、方法和原则,术语的表示,汉语术语的精简和缩写规则,术语生存周期,术语更新原则,专有名词的命名,术语的自动提取,术语乱用与术语法。  相似文献   

5.
同义现象是术语学界长期关注的热点问题,也是当代极具现实意义和有争议的问题。术语的同义现象是建立在表达同一个专业概念的不同术语单位基础上的一种语义关系。通过对医学各领域同义术语(主要是俄语和英语)的分析和描写,划分同义术语的类型,确定现代医学术语的特点,进而发现现代医学双语(主要是英俄、汉俄)词典中暂时还缺乏关于在术语系统功能化条件下使用某一同义术语的相关信息。因此,英俄、汉俄医学词典应对同义术语做相关的信息标注,以帮助使用者选取某一具体医学领域最适合的同义术语。  相似文献   

6.
收集整理规范术语的异名,用于开发面向应用的术语纠错工具,可使规范科技术语的宣传与推广工作达到事半功倍的效果。规范词异名是指与国家审定公布的规范科技术语"正名"表达相同概念,但词形不同的非推荐名。规范词异名的认定需经过收词和审词两个阶段。收词方法包括人工收集和自动抽取。通过规则和统计并举的自然语言处理技术进行自动抽取,可以有学科领域关联、英文术语一词多译关联、语义网络关联三种路径。规范词异名的人工收集和审词重在确保语义等价。  相似文献   

7.
科技术语的符号学诠释   总被引:2,自引:0,他引:2  
术语是通过语音或文字来表达或限定专业概念的一种约定性符号[1] ,术语规范化实质上是一个建立规范的文字符号模型并使其成为全社会定约的过程。基于上述认识 ,我们可以借鉴符号学、语言学、编辑学等学科的一些基本理论来研究术语学问题。本文即是从科技术语是形式和意义相结合的符号系统这一视角出发 ,应用符号学的若干基本原理 ,提出和探讨术语符号的一些基本性质及构成特性问题。  一、符号和术语符号在人类发展过程中 ,由于生产劳动的社会性 ,人们需要经常交流思想、密切协作 ,而这种交往与合作 ,要求人们能够明确无误地表达出自己的…  相似文献   

8.
法律术语特征研究   总被引:1,自引:1,他引:0  
阐述了以三种方式快速获取候选法律术语集,并对该候选法律术语集进行人工术语标注来构造法律术语库的过程。再通过研究法律术语库,最终获得了法律术语的长度和一系列构词法特征。  相似文献   

9.
阐述了以三种方式快速获取候选法律术语集,并对该候选法律术语集进行人工术语标注来构造法律术语库的过程。再通过研究法律术语库,最终获得了法律术语的长度和一系列构词法特征。  相似文献   

10.
正全国科技名词委主办的术语知识服务平台——术语在线(www.termonline.cn)自2016年8月正式上线,向全社会免费提供了术语检索、术语管理、术语识别与标注等功能。一年多来,平台累计提供了500万次检索查询服务,已服务50余个国家和地区,受到科研、出版、翻译等众多领域用户的好评,先后与中国国家图书馆、中华医学会等二十余个机构建立了合作关系。  相似文献   

11.
双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义。双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的。然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双语平行语料也很难具有较大规模。但是同一领域中各种语言的单语术语库却较易获得。为此,提出一种基于两种不同语言的单语术语库自动实现术语对齐,以构建双语术语对照表的方法。该方法首先利用多个在线机器翻译引擎通过投票机制生成目标端“伪”术语,然后利用目标端“伪”术语从目标端术语库中检索得到目标端术语候选集合,最后采用基于mBERT的语义匹配算法对目标端候选集合进行重排序,从而获得最终的双语术语对。计算机科学、土木工程和医学三个领域的中英文双语术语对齐实验结果表明,该方法能够提高双语术语抽取的准确率。  相似文献   

12.
文章从问题意识视角出发,以石油术语为基础,引入词向量空间模型的方法展开三个相关实验对机器译文和人工译文进行对比研究,探索机器翻译结果在空间模型中的演绎和呈现。实验结果显示机器翻译对于石油术语的语言翻译准度能达到0.403。文章尝试结合计算机技术、语言学和翻译学等不同领域量化论证两种翻译结果在语义层面的接近和靠拢程度,以期探索评价分析机器翻译系统输出结果质量的新途径。  相似文献   

13.
Incremental Classification with Generalized Eigenvalues   总被引:2,自引:0,他引:2  
Supervised learning techniques are widely accepted methods to analyze data for scientific and real world problems. Most of these problems require fast and continuous acquisition of data, which are to be used in training the learning system. Therefore, maintaining such systems updated may become cumbersome. Various techniques have been devised in the field of machine learning to solve this problem. In this study, we propose an algorithm to reduce the training data to a substantially small subset of the original training data to train a generalized eigenvalue classifier. The proposed method provides a constructive way to understand the influence of new training data on an existing classification function. We show through numerical experiments that this technique prevents the overfitting problem of the earlier generalized eigenvalue classifiers, while promising a comparable performance in classification with respect to the state-of-the-art classification methods.  相似文献   

14.
This paper focuses on combining association measures using corresponding receiver operating characteristic curves. The approach is motivated by a problem of automatic bigram collocation extraction from the field of computational linguistics. It is based on supervised machine learning techniques and the fact that different association measures discover different collocation types. Clusters of equivalent ROC curves are first determined by a testing procedure. The paper’s major contribution is an investigation of the possibility of combining representatives of the clusters of equivalent association measures into more complex models, thus improving performance of the collocation extraction.  相似文献   

15.
国际术语信息中心(Infoterm)的术语规划包括术语培训和会议、术语荣誉、术语合作、术语政策或策略、术语知识产权相关法律法规、术语资源的无障碍获取、术语标准化、术语管理、术语出版等。国际术语网(TermNet)的术语规划主要包括组织规划,举办大型国际会议和培训、合作开展术语资格认证等活动规划。中国的术语规划可考虑:加强国内术语规划与合作力度,构建面向全球的术语合作体系,加快培育满足新形势需求的术语学理论与应用人才队伍,搭建大型术语工作平台等。  相似文献   

16.
文章介绍了加拿大学者安杰拉·坎波的长篇论文《对欧根·维斯特著作的接受和术语学的发展》的主要观点,及西方术语学领域的最新发展。在术语学的发展史上,欧根·维斯特的著作,一直是各国从事术语学工作和研究的学者们的灵感源泉。维斯特被公认为“现代术语学之父”。自20世纪90年代初,随着科技和相关领域的迅猛发展,术语学领域也出现了新的工作方法或理论导向,它们大都对传统术语学持批评态度,由此引起了激烈的学术争论。安杰拉·坎波以拉卡托斯提出的“科学研究纲领方法论”作为解释模型,有力地说明了现代术语学是一个在理论和方法论上更加强大的独立学科。  相似文献   

17.
科技术语翻译在全球贸易、科技传播中起着举足轻重的作用,但还存在不准确、不规范和不一致等现象,例如在线词典、机器翻译引擎、在线百科等提供的新冠肺炎和新冠病毒的译法。梳理了科技术语翻译标准和多模态大数据语境理论框架。基于科技术语与翻译方面权威的规范文献的国际国内标准和术语翻译标准的相关研究等可归纳为准确、简明、一致、规范的术语翻译标准;多模态大数据语境则指术语可通过文本、图片、网页等多模态语境传播,整个网络具有多模态语境互文性。文章以新冠肺炎和新冠病毒术语翻译标准化为例,基于网络、数据库检索、图文等互文性语境,以及现有相关研究,分析在科普和学术论文场合的翻译惯例,根据术语翻译标准,更全面归纳了标准化汉英翻译,包括优选术语、全称、曾称和简称等,示范了英语科技论文中全称和简称的写作方式等,可为在线词典、机器翻译中术语优化和科技名词规范等术语翻译标准化相关工作提供参考。  相似文献   

18.
中医术语的西班牙语翻译研究,是基于中医药“走出去”和中华文化对外传播的探索,旨在提高中医术语西班牙语翻译水平,促进中医药文化传播,而术语工具书的选择对相关翻译工作起着重要的参考作用。《中医基本名词术语中西对照国际标准》是目前世界上比较权威的中医术语西译工具书,研究通过对该书的综合分析,结合术语学理论,深入讨论了中医术语西译的现状、存在的困难和问题。为了完善中医术语多语种信息,提高中医术语翻译质量,研究提出借鉴欧盟多语种互译术语语料库模型,为建立中医术语多语种语料库提供参考。  相似文献   

19.
20世纪90年代至今,虽然传统术语学思想受到多方质疑,但当今全球化的术语学理论和实践并没有到消极的“十字路口”。与之相反,术语学建设变得更加稳健和朝气蓬勃。文章从科学哲学的角度,论述西方学者提出的“术语学是一种科学研究纲领”的思想,并对交流(交际)术语学在术语学发展中的作用做粗浅评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号