首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
藏语虚词研究是藏语自然语言处理中一项不可缺少的基础性工作,有着极其广泛的实际应用价值.它是藏文信息处理的核心和藏语自然语言理解的基础,在藏文校对、信息检索、双语对译、自动分类等技术中有着广泛的应用前景.文章在前人研究的基础上,结合信息处理,从不自由虚词的分类体系、形式化描述等角度对藏语虚词la格的语法功能做了一些探讨,重点论述了藏语虚词la格的语法功能,提出藏语虚词规范的初步设想和处理方法.  相似文献   

2.
语料中抽取句子是藏语自然语言处理领域中一项关键技术,在句型研究、句法分析、语义分析、语用分析、问答系统和机器翻译等很多领域都有广泛的应用前景.文章在分析藏语句尾词性和虚词特征的基础上,提出了一种基于虚词和句尾词特征的藏语句子抽取方法,即从文本串的单垂符或双垂符开始,通过逆向搜索虚词的位置节点和句尾词性抽取藏语句子.实验表明,该方法抽取藏语句子的准确率可达98.9%以上,抽取句子的数量明显提高.  相似文献   

3.
藏语传统语法对词的类别划分不是很细化,藏语词典中除了名词、动词和形容词以外,对其他词类的描述也处理得较为模糊,更突出的是词和短语的界限不明,且时而还有句子出现在词典中。对于虚词不能停留在词类层面的标记,对其进行句法和语义范畴的标记在文本理解中尤显重要,这是由于虚词在结构性很强的藏语中扮演着句法架构和语义桥接的重要角色。文章从语义关系和藏语虚词功能、功能性虚词分类等方面探讨了藏语虚词的功能标记问题。  相似文献   

4.
在藏文文本理解中虚词发挥着重要的句法、语义桥接作用,其规则的有效性在藏文分词处理中扮演着特殊的角色。由于虚词本身及其角色的丰富性,在一定意义上可以说藏文分词处理是虚词识别的过程。因此,虚词识别的正确与否直接影响着藏文文本分词处理的效果。文章依据藏语自身的语法规律和虚词功能的特殊性,首先构建了虚词知识库、虚词兼类库,以及其作为藏文连续文本中识别虚词的依据;其次,研制了标有词汇属性的分词词表和一定规模的训练语料库资源,以基于条件随机域(CRF)的方法进行词性标注,并结合虚词和词性赋码的资源制作了藏文自动分词赋码一体化处理的模型。  相似文献   

5.
基于统计的语料库语言学已经成为语言信息处理研究的主要方法 .文章就1 341个藏文的单音节动词,从形态、句法和语义等层面归纳为17类属性,在此基础上,统计动词各类形态结构的数据,描述了每个动词的特征信息,分析藏语动词在句法和语义结构之间的对应关系,构建了一个以形态和句法特征为主、兼顾语义信息的藏语动词知识库,为进一步搭建藏语动词框架语义库和创建藏语句法树库奠定了基础.  相似文献   

6.
俞敏先生为古汉语虚词提供了新的研究路向。他的研究突破了传统语言学仅依靠汉语古文献内部证据的局限,将与汉语同语系的藏语的语法作为虚词研究的重要旁证;借鉴了俄语、英语、法语和拉丁语等语言的语法及汉语各地方言的语法来对古汉语虚词进行研究;并运用语流音变对王引之提出的"声近义通"等现象进行了精确的阐释。  相似文献   

7.
文章介绍了语义格、Frame Net、Prop Bank、CPB、Nom Bank、CFN和北大中文网库等语义知识库和语义标注语料库和国内外论元结构理论和语义角色体系.采用论元结构分析理论,以藏语逻辑格为对象,详细分析了受动格、施动格、目的格、来源格和处所格所包含的语义角色,探讨了藏语动词和格助词对藏语语义角色的预测能力,提出了一个藏语语义角色体系的雏型.  相似文献   

8.
文章在win8操作系统支持下,设计并实现了基于音节的现代藏文文本校对功能。通过分析和研究藏文音节的拼写规则,对传统藏语中的音节拼写规则进行了详细的形式化描述。采用统计方法对藏语音节的搭配规则做了探索性的研究,创建了音节搭配规则知识库,以这些知识库为基础进行音节模式匹配查错,创建了音节规则校对模型,运用音节规则模型实现现代藏文文本的音节级校对功能。  相似文献   

9.
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。  相似文献   

10.
文章就藏文字处理领域对藏文校对功能的实际需要,提出了基于音节的藏文文本校对方案对藏语音节规则的详细描述.采用统计方法对藏语音节的搭配规则等做了探索性的研究,创建了音节及音节搭配规则等多种知识库,以这些知识库为基础进行音节模式匹配查错.设计实现了音节规则模型与音节库模式匹配方法相结合的音节级查错.通过借鉴藏文传统语法理论、现代语言学理论、计算机技术和统计学理论等知识,介绍了藏文文本校对的设计思想,给出了藏文文本校对系统的组成原理、关键技术及可操作的实现方法.实验结果表明,基于音节的查错方案是可行的.为进一步研究开发藏文智能校对软件提供了所需的规则特征集和统计语料等基础性的研究资料.也为将来实现基于词、语法和语义层面的校对奠定了基础.  相似文献   

11.
基于朴素贝叶斯的垃圾邮件分类系统的设计   总被引:1,自引:0,他引:1  
结合垃圾邮件分类系统的具体要求,在传统规则分类方法的基础上引入机器学习的知识,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法,并详细讨论了一个基于朴素贝叶斯方法的个性化垃圾邮件分类系统的设计。提出的分TFIDF特征子集提取算法和朴素贝叶斯方法对邮件进行分类具有较好的分类精度,应用朴素贝叶斯方法在新邮件到达的同时对其进行分类,具有较好的分类速度。  相似文献   

12.
对于自动翻译研究而言,首要任务是建立语言的机器词典.这一机器词典是多语言的,它包括汉语、英语机器词库.自动翻译中单词与词组的分析和处理涉及多方面的问题.这是本文探讨的主要内容.  相似文献   

13.
“所”是一个由来久远、语言学界多有争议的文言虚词。本文从“所”的本义、“所”的用法源流、“所”的词性、专书“所”的研究、“所”与相关虚词的比较研究、“所”字研究的新途径等六个方面,对语言学界有关“所”字研究的成果,作了客观简要的历史性回顾和评述。  相似文献   

14.
目前,高准确率的语音识别需要在大规模语料库上进行学习才能获得,然而大规模语料库的构建成本较高,某些语言很难采集到充足的语料,因此,基于小规模语料库的语音识别已成为目前挑战性的研究问题.元学习是模仿人类利用已有经验快速学习新知识的机器学习方法,在机器视觉单样本学习任务中表现出明显的优势,已成为新的机器学习研究热点.将元学习应用于单样本语音识别是解决基于小规模语料库语音识别这一挑战性问题的有效途径,在TIMIT和佤语数据库上,开展了基于Reptile元学习算法的单样本孤立词语音识别研究.实验结果表明,该算法能有效地提升模型收敛速度与泛化精度,从而提升了模型的学习能力,说明元学习方法有助于解决小规模语料语音识别这一挑战性问题.  相似文献   

15.
数控机床可用性是可靠性、维修性和维修保障性的综合反映,是用户最为关心的一个特性。它不仅受数控机床功能故障的影响,也受诸如精度退化、性能波动、漏油等性能故障的影响,因此,孤立地研究国产数控机床的可靠性(功能故障)不足以维持产品的“可用好用状态”。分析了国产数控机床可用性的现状及研究意义,对数控机床可用性建模方法和数控机床维修决策方法的国内外研究现状进行了阐述,总结了数控机床可用性研究存在的问题和发展动态,对基于元动作单元的数控机床可用性系统化建模和以可用性为中心的数控机床主动维修决策两个亟需解决的关键科学问题提出了见解,以期为数控机床可用性研究提供思路。  相似文献   

16.
句型转换式机器翻译涉及的技术很多.主要工作有四部分:第一部分给出一种自动分词边界问题处理方法;第二部分探讨一般句与疑问句的句型结构;第三部分研究汉英机器翻译的译文生成问题;第四部分是一种"是"动词"am;is;are"的处理方法.  相似文献   

17.
在对蒙古语语法信息进行研究的基础上,设计了蒙古语单词词性自动识别系统.介绍了词性识别所需要的知识库及识别系统的设计和实现方法.  相似文献   

18.
诗学的演变首先都是基于其主要知识范式的,当"今文学"的权威和神圣光环还没有退却前,它仍旧是晚清"今文学"家诗学存在及其发展所必须遵循的金科玉律。晚清"今文学"出现了衰落,并由此造成了"今文学"诗学话语的现实困境以及诗学美学话语的呈现,进而实现了诗学经学话语向诗学美学的裂变,最终导致了晚清诗学知识范式的嬗变。至此,中国诗学也由传统开始彻底走向了近代。  相似文献   

19.
"诗用实字易,用虚字难"。在古典诗歌尤其是近体诗中恰到好处地运用虚词能有效地增添诗歌的声情韵致,显现诗句的意脉流动,丰富诗歌的审美情趣。古代诗人中杨万里是继杜甫之后善用虚词的高手,恰到好处的虚词也是"诚斋体"独特艺术风格形成的重要因素,值得作深入地探讨。  相似文献   

20.
调查发现,修辞学上的tenor和vehicle在文献中的译名比较混乱。原因有二:译者不了解汉语中已经存在现有的名称;常用的非专业性英汉和汉英词典均没有收录tenor和vehicle的修辞含义。因此认为,tenor和vehicle的译名宜统一为“本体”和“喻体”;译者有必要提高汉语水平,以便在需要时能随时调动母语中现有的表达方式;一些大众熟悉的常用术语应该被收录进常用非专业性英汉和汉英词典。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号