首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
文章对藏文中的名词+名词(N1+N2)短语的直接成分和语法功能进行了分析,并详细阐述了名词+名词(N1+N2)短语的语法组合关系和语义结构、性质、功能及其词义的联想和搭配等,实例分析了藏文名词性短语的韵律特征。  相似文献   

2.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

3.
文章依据所抓取的大量藏文网页URL,对相关的藏文信息网页进行除噪去重处理,得到较为完善的藏文信息库。对用户要查询的藏文信息进行预处理和藏文语义标注,通过基于本体的词汇相关性算法,扩展藏文的查询词汇,建立一对多的藏语词汇联系,从而实现藏文查询中的相关性检索,得到更加符合用户需求的语义关联网页信息。  相似文献   

4.
名词短语在自然语言处理中具有重要的地位.文章首先从语言学角度定义了名词短语,然后为名词短语识别的问题设计了一个序列标注模型,最后将隐马尔科夫支持向量机用于学习该序列标注问题.实验显示取得了满意的准确率和召回率.  相似文献   

5.
藏文框架语义知识语义关系分析的关键就是建立句子中各词语之间的语义关联关系,实现各框架间知识的共享,获取更多的信息.文章引出了藏文框架语义知识、框架及框架元素并结合实例分析了以藏语句子为主,组成该句子的词语或短语间的语义关系及框架形式表示该句子的语义为结构化.  相似文献   

6.
名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SYM法在小样本模式的开放测试中表现良好,而最大熵方法在两种测试中的识别结果均比较理想。分析表明,HMM方法侧重应用在与线性序列相关的现象上;SVM方法适用于有限的汉语带标信息的分类问题;而最大熵方法特别适用于把不受限的文本特征加入统计模型中的情况。  相似文献   

7.
文章运用TIGERSearch软件中两种不同的语料库模版Christine和Susanne,研究以代词和名词为中心词的名词短语在英语口语和书面语中作主语和宾语的频率,将所得结论与其他学者的研究结果进行比较,进一步证明名词短语在英语口语和书面语中运用时的区别。  相似文献   

8.
文章采用基于规则的方法进行汉语基本名词短语的识别,定义了一套适合计算机处理的汉语组块体系,并设计实现了一种基于规则组块自动识别算法。在封闭性测试中,该算法的准确率达到87%。  相似文献   

9.
相对于确定性而言,英语字词语义具有不确定性。它主要表现为模糊、有歧义、含混等。情况十分复杂,界限十分模糊,易产生误解,尤其是表现在缺乏语境、没有上下文的句子里,若不提供背景信息,两种或两种以上的理解听上去都是合情合理的。这给准确理解造成一定的困难。本文就多义名词、同形异义名词以及单、复数名词的语义模糊性进行了分析和阐述。  相似文献   

10.
随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源。在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语。已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其他含动词的名词短语,加之含动词名词短语识别存在分词错误、边界确定、特殊结构、标记数据少等难点,含动词名词短语识别目前仍然是一个巨大的挑战。基于此,文章提出了一种神经网络与规则、统计相结合的方法。首先对语句进行预处理,其中包含包括词性、助词、时间、数量词等内容的修正和合并;然后,使用双向LSTM与条件随机场融合的方法对含动词命名实体进行识别;接着使用百度词条、固定搭配、语义分类和描述框架文法的方式对含动词名词短语识别;最后使用随机抽取的多动词文本进行实验和分析,实验结果表明,本文方法达到89%的准确率。  相似文献   

11.
文章以框架语义学为理论基础,以消息域为研究对象,探索藏文自然语言处理中藏语框架语义分析的理论和方法,探讨了用框架描述消息域的知识方式,并用语义框架项的描述及消息域框架间的层级关系设计了藏文消息域框架语义系统,为藏文典型实例的分析提供支撑.  相似文献   

12.
语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。  相似文献   

13.
中文信息处理是人工智能领域中的一个重要分支.中文自动分词是中文信息处理的基础.本文对自动分词现状及其几个技术难点做了一定的探讨,其中特别对自动分词中亟待解决的几个难题之一未登录名词短语识别的现状进行了分析.  相似文献   

14.
自然语言的形式分析和计算机对自然语言的信息处理是当今时代比较热门的研究领域。以转换生成语法、范畴语法和类型论、λ-演算和时态逻辑等为工具分别对现代汉语的若干类NP短语中的领属定语、数量定语、时间定语3种类型作了较详细的形式语义分析,刻画了定语所表示的拥有领属关系、数量度量关系和时间先后长短关系,同时对不同种类的定语在句法范畴和语义类型的形式处理方面作了严格统一的处理,有助于汉语的计算机信息处理。  相似文献   

15.
哈尼语中植物名词的义素、义位、语义有着特定的组合,植物名词义位同其他词类义位的组合以及植物名词语义特点都与哈尼族社会文化有着潜在的关系。  相似文献   

16.
用光杆短语结构理论分析英语和汉语中的生成性名词短语,认为汉语中的一部分"的"字结构、"者"字结构和英语中的"the+形容词"、"the+分词"以及"通过词缀名词化的短语"都是生成性的名词短语,它们都可以被描述为限定词短语,限定词短语具有名词性。在这项研究中英语与汉语呈现共性,名词短语与句子也呈现共性。  相似文献   

17.
试析科技英语篇章中名词(或名词短语)的重复   总被引:1,自引:0,他引:1  
科技英语篇章发展过程中存在一种重要的词汇衔接手段,这就是名词(或名词短语)的重复。本文试图地科技英语篇章中名词(或名词短语)的重复现象进行分析并提出以下五种类型的重复:一,安全重复,二,缩略重复;三,用同(近)义词表达的重复;四,用上义词替代下义词的重复;五,用下义词加脂上义词的重复。本文还就各种重复情况下名词(或名词短语)的回指照应关系进行了详细分析。  相似文献   

18.
文章用GOOGLE开源的Word2Vec工具把藏文文本《贤者喜宴》经过分词后的语料作为输入,将文本中的词映射到一个K维空间,利用词汇的上下文信息将词转变为词向量.Word2Vec工具再通过学习得到一个向量模型,每一个词都用一个独特的词向量来表示.训练文本数据构造一个词表,然后学习词的向量表示.词向量能够捕获许多语言的规律,从而得出词与词之间的距离即相似度.进一步通过高频词汇作为输入,通过训练即可输出与高频词汇距离最近的词汇,以高频词和与其相近的词汇作为重要信息去预测文本的大致语义.实验结果表明基于Word2Vec训练模型的准确率和召回率都很高.  相似文献   

19.
根据不良信息的特点对潜在语义分析(Latent Semantic Analysis LSA)进行了简化,并设计了基于简化的潜在语义分析(Latent Semantic Analysis Of a Simplified LSAS)的藏文Web不良信息检索算法.该检索算法能够对具有关于某个主题的特定倾向的文本进行过滤.该系统充分利用了领域知识,采用了潜在语义模式分析等技术.实验表明该系统具有查全率和查准率高,速度较快的特点.  相似文献   

20.
名词和定名短语,人们往往把其当做一个整体来看待,对二者的差异关注得不够。经研究发现,二者在成句功能上存在差异:定名短语对语境的依赖性较弱,实现为陈述、感叹、疑问等句类的能力强于名词。更有资格充当复句的分句;名词实现为呼应句的能力则强于定名短语。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号