首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
中文分词中歧义切分处理策略   总被引:1,自引:0,他引:1  
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.  相似文献   

2.
叶西切忠  安见才让 《科技信息》2011,(31):236-236,256
藏文分词是藏文信息处理领域的一项不可缺少的基础性工作,也是智能化藏文信息处理的关键所在。在藏文分词的研究过程中藏文分词的准确性,直接制约着藏文输入法研究、藏文电子词典建设、藏文词频统计、搜索引擎的设计和实现、机器翻译系统的开发、藏文语料库建设以及藏语语义分析研究等高层藏文信息处理技术的进一步发展。本文借鉴汉语的分词理论和方法,提出符合藏文特性的分词方法,以及歧义字段切分和未登录词识别等相关问题,并举例说明。  相似文献   

3.
汉语自动分词中中文地名识别   总被引:6,自引:0,他引:6  
以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句子最佳切分时识别句子中的中文地名.对真实语料进行封闭和开放测试,封闭测试结果为召回率93.55%,精确率94.14%,F-1值93.85%;开放测试结果为召回率91.27%,精确率73.48%,F-1值81.42%.取得了比较令人满意的结果.  相似文献   

4.
HENU汉语自动分词系统中歧义字段消除算法   总被引:2,自引:0,他引:2  
先用基于词典的最大匹配法匹配出最长词和次长词,再用检测跨越的方法发现切分歧义,判断出切分歧义是交集型切分歧义还是组合型切分歧义,根据切分歧义类型的不同分别进行切分歧义的消除.交集型切分歧义的消除方法主要是混合使用基于规则的方法和基于统计的方法,组合型歧义的消除方法主要是使用基于规则的方法,找到正确的切分位置.  相似文献   

5.
书面汉语自动分词及歧义分析   总被引:8,自引:0,他引:8  
歧义现象是自动分词过程中不可避免的现象,本文通过对自动分词过程的分析,总结出书面汉语自动分词中歧义产生的根源,提出处理这些歧义字段的方法.  相似文献   

6.
针对目前中文分词技术主要依赖于常用词词典,而词典对未登录词识别率较低的问题,提出一种用双词典识别未登录词的方法,即构建一个常用词词典和一个单字词词典,二者相互结合进行分词,有效解决了对未登录词识别效率偏低的问题.实验表明,采用构建单字词表法对未登录词的识别准确率可达90%以上.  相似文献   

7.
介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统计结果分析出的最有可能是词的子串作为临时词;最后利用中文语法的上下文关系并结合词典对原文进行分词处理.系统对未登录词的分词有很好的效果.  相似文献   

8.
中文是一种没有明显的形态界限可以作为分词依据的表意语言,因而在中文文本的处理中面临的第一个问题就是词语的切分问题。本文说明了汉语自动分词的必要性和困难,介绍了自动分词的三种算法。  相似文献   

9.
基于最长次长匹配的汉语自动分词   总被引:11,自引:1,他引:11  
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。  相似文献   

10.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

11.
对于自动翻译研究而言,首要任务是建立语言的机器词典.这一机器词典是多语言的,它包括汉语、英语机器词库.自动翻译中单词与词组的分析和处理涉及多方面的问题.这是本文探讨的主要内容.  相似文献   

12.
在机器翻译的研究中,混合式方法是一种好方法.本文的主要工作有两部分:第一部分提出一种近似机器翻译的算法;第二部分针对自然语言在各个层次上普遍存在的歧义性,对语言歧义的问题进行分析,论述一些具体消歧方法.  相似文献   

13.
汉英语言存在着较大的文化差异,其中颜色词的文化差异极易导致东西方人理解的误区。以红、蓝、白为例,从分析该三种颜色词的文化内涵异同的角度出发,通过举例,指出对颜色词的翻译须建立在对当地风俗、历史和文化背景等诸多方面有所了解的基础上,再根据语境,仔细斟酌,不可望文生义。最后对英汉两种语言颜色词差异的原因进行了探讨。  相似文献   

14.
介绍了多路温度监测及自动拨号语音报警系统的硬件结构和工作原理,系统相关数据的存储、8路温度数据的采集和监测、语音录制、自动拨号语音报警等技术的实现.用C语言编程,实现了多路温度实时监测、实时语音报警等功能.系统具有实时性及智能化等特点.  相似文献   

15.
介绍了多路温度监测及自动拨号语音报警系统的设计,阐明了有关的工作原理、关键技术和硬件设计.系统充分应用PIC单片机以及语音芯片等器件,使系统具有智能化特点.主要应用于仓库、蔬菜水果贮藏室、企事业单位等有一定环境温度要求的场所.通过对温度实施监测,达到防火、防热、低温防冻及蔬菜水果保鲜等目的.  相似文献   

16.
现代汉语歧义研究之现状和趋势探究   总被引:1,自引:0,他引:1  
自赵元任先生1959年发表《汉语的歧义问题》一文开始,汉语歧义研究历经数十年,研究内容涉及面甚广,然而由于没有选择合适的研究对象,比如词组和句子,导致了语法歧义与语用歧义的纠缠。詹卫东和杨亦鸣的两篇文章运用计算语言学和实验语言学方法消除这种纠缠现象,揭示了现代汉语歧义研究的新趋势。  相似文献   

17.
魏洁 《科技信息》2008,(31):273-273
This paper mainly discusses the openness and assimilation of the words system from the viewpoint of loan words between English and Chinese.Both the history of loan words and the ways of borrowing words in English and Chinese have shown us the strong abilities of languages.  相似文献   

18.
从英语外来词汉化翻译的主要形式出发,阐述英语外来词的汉化翻译受现代汉语语言特点的规约,并探讨汉语吸收外来词过程中潜在的语言认知心理,以期更好地理解和吸收英语外来词。  相似文献   

19.
主要介绍了一种通用试题库管理系统中自动组卷算法的实现.提出的算法充分考虑组卷时的各种因素,并采取有效措施降低选题的失败可能性.通过与试题分析模块的结合,采用一定的学习方法,使得试题的难度和区分度等参数逐渐反映出试题的真实情况.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号