首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
文章以框架语义学为理论基础,以消息域为研究对象,探索藏文自然语言处理中藏语框架语义分析的理论和方法,探讨了用框架描述消息域的知识方式,并用语义框架项的描述及消息域框架间的层级关系设计了藏文消息域框架语义系统,为藏文典型实例的分析提供支撑.  相似文献   

2.
知网、HNC和框架网的语义知识表示异同   总被引:1,自引:1,他引:0  
语义知识的表示和使用是自然语言处理的重要方面.知网从描述词语之间的关系以及属性之间的关系入手建立了中文词语语义知识的表示方法.HNC设计了语义概念基元和语句基元,形成了自然语言的概念空间,用基元描述语句理解处理中知识.不同于以上两种方法.框架网则是根据单词的不同的义项对应不同的语义框架,用不同的语义唤醒激活不同的框架,从而理解词语的语义.在此比较了三者在语义知识表示方面的异同.  相似文献   

3.
以藏文音节拼写检查、梵音转写藏文检查、接续关系检查、词语检查为研究内容, 提出藏文文本自动校对框架和接续关系检查算法。根据该框架及算法, 设计并实现藏文自动校对系统。通过实验证明算法和系统的可靠性和有效性。  相似文献   

4.
句子语义距离计算在许多智能系统中发挥着重要的作用.针对句子语义知识的表达方式、语义框架,提出一种基于语义同构的语义距离算法,通过计算代表句子语义的两个语义框架的最大同构子框架和最大包容子框架,计算句子的语义距离,并且通过动态调整句子成分的权重,提高算法的有效性.实验证明,该算法可以使语义距离计算精确率达到97.7%,与现有方法相比具有更高的精确度.  相似文献   

5.
传统的TF-IDF算法主要依赖词频,往往忽略词语语义和一些具有重要意义的副词。针对这一问题,提出了一种基于语义分析的改进TF-IDF算法。该方法融入了词语语义来计算词频,改进了反义词语之间的相似度。实验结果表明,该方法在计算句子相似度中能根据语义方向对句中各词语词频进行统计,同时判断整个句子语义方向,与传统算法比较,语句相似度的准确性提高了5. 7%。  相似文献   

6.
顾军霞 《科技信息》2007,(1):135-136
英语词语在语义方面所展现的连锁关系包括上下义,集合,同义,照应(指代),并列,递进和比较与时照等关系.英语词语语义的连锁关系展示了句子各部分意义的相互关系,构成了阅读理解和英汉翻译的基本平台.  相似文献   

7.
传统藏文文法格在功能上真实地反映了藏文句法结构,藏文中的属格表示人或事物之间的限制或领属、修饰、复指、总别和依存关系等,可作前置定语.藏文中名词短语是指语法功能相当于名词的短语,一般可以在句子中充当主语、宾语、定语等.文章采用语料实证和结构分析的方法,从句法功能的角度对属格助词在藏文名词短语中的结构及功能进行分析研究,从句法结构上总结和归纳了其结构特征,为多语言句法结构树库和框架语义构建提供最基本的语法信息.  相似文献   

8.
量子理论所具备的叠加、纠缠、不相容和干涉等特征使其成为优秀的建模框架.研究了量子理论在自然语言理解方面的应用潜力.在自然语言句子匹配任务上,探讨了量子理论作为一种形式化框架捕捉句子、词语的语义和语义建模上的能力:利用量子态构建句子的语义Hilbert空间,计算句子信息变换过程中信息的保真度;与此同时,将量子理论与Wor...  相似文献   

9.
藏文句子边界识别作为藏文信息处理研究领域中的一项重要工作,在词法分析、句法分析、语义分析和机器翻译等领域都具有广泛的应用.在分析藏语句子的概念、分类和边界特征的基础上,提出一种基于混合策略的藏文句子边界识别方法.经实验模型在测试数据集上的F值达99.25%.  相似文献   

10.
用框架表示知识是人工智能乃至语言工程中一项最为重要的基础工程和基础资源之一.文章结合实例分析了藏语词语语义框架,并通过对词语认知过程的理解来组织框架,进而对框架进行结构信息的描述.  相似文献   

11.
探讨了一种适合于汉语理解的、面向语义的、新的语言分析方法。该方法是以知识图这种新的知识表示方法为语义模型,模拟人的语言感知过程,先对整个句子进行语义片段的划分,再对每个片段进行分析。  相似文献   

12.
IntroductionMuch recent research on statistical parsers hasfocused on English.English has a large syntacticcorpus,the English UPenn Treebank.Everysentence in this corpus corresponds to a syntacticstructure[1] .Many kinds of parsers for Englishhave been developed based on this corpus[2 4 ] .Thestructure of the Chinese language is quite differentfrom English and there have been only a fewefforts to build syntactic corpora in recent years.Two syntactic corpora were just announced in2 0 0 0 ,t…  相似文献   

13.
目前,在基于HowNet进行语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想.为了更好地解决上述缺陷,提出了一种频率增强语句语义相似度算法.该算法利用HowNet作为词典库,在同时考虑义原距离和义原深度的条件下,进行词语相似度计算;在此基础上算法进一步将词语在语料库中的频率函数作为权重值,引入至语句的语义相似度计算中,以降低高频率词语在语句相似度值中的比重.实验表明,改进的算法在语句相似度计算结果上与人们的主观判断更接近,结果更合理.  相似文献   

14.
句子的语义是一个系统,组成句义系统的语义单位可以从小到大划分为义征、义词、义组和义句.义征规定着义词之间组合的可能性以及组合后的语义关系;义词是语义结构的最小单位;义词和义词之间通过义征匹配关系组成义组;义句是以句子的形式负载一个完整信息的语义单位,是句子语义结构的最大单位.  相似文献   

15.
语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。  相似文献   

16.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

17.
It is difficult to analyze semantic relations automatically, especially the semantic relations of Chinese special sentence patterns. In this paper, we apply a novel model feature structure to represent Chinese semantic relations, which is formalized as "recursive directed graph". We focus on Chinese special sentence patterns, including the complex noun phrase, verb-complement structure, pivotal sentences, serial verb sentence and subject-predicate predicate sentence. Feature structure facilitates a richer Chinese semantic information extraction when compared with dependency structure. The results show that using recursive directed graph is more suitable for extracting Chinese complex semantic relations.  相似文献   

18.
Corpus is a kind of important resource for knowledge acquisition in the natural language processing(NLP). However, up to now, in the biomedical domain comparatively fewer corpus focus on semantic association among all tokens in a sentence. We proposed an annotation scheme based on feature structure theory for enriching biomedical domain corpora with token semantic association(TSA). There are 227 documents of the Bio NLP GE ST training data annotated to form TSA corpus in which each annotated item shows a token semantic association that appears as a triple. The annotation of token semantic association has the potential to significantly advance biomedical text mining by providing rich token semantic information for NLP systems especially for the sophisticated IE systems, such as bio-event extraction.  相似文献   

19.
开放语义网络是对格语义网络和概念语义网络扩充,它是针对现实世界的开放属于 而提出的一种语义网络模型,本文对其实现机制进行了探讨,通过赋予网络中节点以主动协商能力,让其适应语境,同时指出自然语言知识表示系统中,应将一个语言成分看作是向外辐射的,而不仅仅是内凝的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号