首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 452 毫秒
1.
藏语句子边界识别是一项重要的基础性工作,它的准确率直接影响藏语句法分析、汉藏(或藏汉)平行语料库和藏汉(或汉藏)机器翻译等的研究工作。文章通过分析藏文文法知识,提出了一种比较简单而实用的词性规则法,其主要思想是:单垂符或双垂符的前后词性来判断句子是否结束。经测试,文章提出的藏语句子边界识别方法在文学类、诗歌类、医学类和新闻类等536句藏语语料中句子边界的识别准确率达到96.37%。  相似文献   

2.
针对中文的语料,采用基于条件随机场的方法,在词、词性特征的基础上结合最近名词、句法依赖关系和句子倾向性等特征,分析不同特征对于评价对象抽取的影响.实验结果表明,结合了词、句子倾向性、词性、语法依赖关系、邻近名词等特征的条件随机场方法对于中文句子评价对象的抽取更有效.  相似文献   

3.
本文扼要归纳了语法界对分裂句这一语言现象的各种观点,并对这些观点进行分析和论述;进而从分析词性、句子结构和句子功能入手,列出这一句型的特殊性,提出分析这种句型的思路和方法。  相似文献   

4.
针对评价对象存在领域相关性这一特点,在条件随机场模型中结合领域词词典特征进行中文句子评价对象的抽取,然后利用领域规则对抽取结果进行处理.针对COAE2011任务三标注语料的抽取实验结果表明,结合领域词词典和领域规则对于利用线性链、跳跃链和层叠条件随机场模型的中文句子评价对象抽取方法可以有效地提高抽取的精度,并抽取出更多的评价对象.  相似文献   

5.
从可比语料中抽取伪平行句对是翻译语料扩充的重要方法之一。汉-越机器翻译是典型的资源稀缺型机器翻译,提高汉越翻译语料的规模能够显著提升汉越神经机器翻译性能。文章提出基于句子特征向量的汉越伪平行句对抽取方法,该方法首先根据汉越句法特性,将汉越句法差异部分的词性融入嵌入层,再使用自我注意力机制的神经网络抽取句子特征,生成一个句子特征向量,用这个句子特征向量来判断汉越句对是否为伪平行句对,实现从汉-越可比语料中抽取汉-越伪平行句对。实验表明,文章所提方法能够有效地从汉越可比语料中抽取出汉越伪平行句对。  相似文献   

6.
提出一种基于句子选择的中文自动摘要抽取算法。算法思想是结合单文档的文档结构、篇章结构、句子特征,按照特征优先权过滤,同时利用进化算法良好的自适应性调节特征因子,通过打分函数自动给句子打分排名,选择得分较高的句子作为摘要句。实验采用中文文档数据集进行测试,采用标准的ROUGE-N评估方法,实验表明该算法针对中文文献取得了良好的效果。  相似文献   

7.
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.  相似文献   

8.
藏语传统语法对词的类别划分不是很细化,藏语词典中除了名词、动词和形容词以外,对其他词类的描述也处理得较为模糊,更突出的是词和短语的界限不明,且时而还有句子出现在词典中。对于虚词不能停留在词类层面的标记,对其进行句法和语义范畴的标记在文本理解中尤显重要,这是由于虚词在结构性很强的藏语中扮演着句法架构和语义桥接的重要角色。文章从语义关系和藏语虚词功能、功能性虚词分类等方面探讨了藏语虚词的功能标记问题。  相似文献   

9.
采用基于最大熵模型的方法对泰语句子级实体从属关系的抽取方法进行了研究.针对泰语句子中实体关系抽取的研究进程中语料库较为匮乏的问题,首先使用汉泰双语平行句对作为中间桥梁,将中文研究领域中相对成熟的分词、词性标注和实体识别等成果,通过汉泰双语词典映射到与中文句子相对齐的泰语句子上,对泰语句子进行必要的数据处理操作,并进行一定量的人工校正和人工实体关系标注工作;进而构建基础的泰语实体关系训练语料库.在语料库的基础上,将泰语实体关系抽取问题转化为分类问题,同时结合泰语语言本身的特点,选取合适的上下文特征模板,使用最大熵模型算法对训练语料进行学习训练,构建分类器,对泰语句子中的候选实体关系三元组进行识别,最终达到实体间从属关系自动抽取的目的.实验结果显示该方法可使F值相对于已有的泰语实体关系抽取研究方法提升8%左右.  相似文献   

10.
藏语虚词研究是藏语自然语言处理中一项不可缺少的基础性工作,有着极其广泛的实际应用价值.它是藏文信息处理的核心和藏语自然语言理解的基础,在藏文校对、信息检索、双语对译、自动分类等技术中有着广泛的应用前景.文章在前人研究的基础上,结合信息处理,从不自由虚词的分类体系、形式化描述等角度对藏语虚词la格的语法功能做了一些探讨,重点论述了藏语虚词la格的语法功能,提出藏语虚词规范的初步设想和处理方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号