首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 127 毫秒
1.
基于语义的自动文摘研究综述   总被引:1,自引:0,他引:1  
基于语义的自动文摘方法能解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量.常用语义模型包括统计主题模型和语义知识模型.基于语义的自动文摘是对传统文摘技术基于语义模型的扩充,在自动文摘的预处理、文档转换、文档候选片段提取和文摘生成4个基本过程中使用各种语义分析方法.  相似文献   

2.
基于领域本体的信息搜索模型   总被引:3,自引:0,他引:3       下载免费PDF全文
针对目前的搜索模型局限于语法层次上关键词匹配的特点,以领域本体作为知识组织方式,提出了一种语义环境下基于本体的信息搜索模型.在此模型的基础上,分别提出了文档语义标注算法和搜索词语义扩展算法,两种算法分别对文档集语义分析和搜索词语义关系理解,实现双向语义信息搜索的目的.实验结果表明,提出的信息搜索方法能够克服关键词匹配搜索的不足,获得较好的搜索效果  相似文献   

3.
基于本体的英汉翻译记忆系统的研究   总被引:1,自引:0,他引:1  
在翻译记忆系统中,句子的语义理解是提高相似句子的匹配率的关键.提出了一种基于本体的英汉翻译记忆系统模型,以计算机文献领域的专业术语为范围构建了一个知识本体CSO,并引入本体的概念相似度进行模糊词对的相似度计算.实验证明,本体的语义信息能提高系统的匹配率.  相似文献   

4.
根据汉语语言的特点,对以中文文本数据库为数据源的汉语关键词自动转换主题词的方法进行了探讨.其方法是通过现有工具和计算机编程语言实现中文文献的分词、筛选统计,然后与主题词表进行匹配,并将最终转换的主题词进行存储.  相似文献   

5.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

6.
基于概念匹配的语义检索模型研究   总被引:1,自引:0,他引:1  
传统的搜索技术,主要集中在关键字匹配方面,基本上没有涉及到语义层次,其查全率和查准率上都无法满足用户的需求;对于当前利用本体推理而实现语义检索的模型,对本体的完整性要求过高,检索范围也局限在某一特定领域;结合本体的知识,利用本体中概念之间关系,提出了一种基于概念匹配的语义检索模型,它减少了对本体完整性的过高要求和对本体的过分依赖,并在一定程度上实现了对用户查询的语义理解和概念区分,扩大了检索领域范围,提高了检索性能。  相似文献   

7.
提出一种基于向量空间模型的多层网页分类方法.该方法用主题词、修正主题词和主题概念从3个层次构建网页表示向量,从而在概念层次上更贴近网页的语义,且向量维数低于传统的特征向量.实验结果表明,该方法降低了分类时的计算量,提高了网页分类速度和分类精度.  相似文献   

8.
本文在已建立的家电领域本体的基础上,提出一种面向家电领域的语义检索模型,该模型一改传统检索方法中机械式字符匹配的弊端,支持基于本体的语义理解.利用SVM分类器、自然语言处理、语义标注等技术,在对查询条件预处理以及资源语义标注的基础上,对标注资源库进行检索,提高了查准率和查全率。  相似文献   

9.
为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题, 提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合, 计算候选概念在领域术语关系中的深度和广度, 利用深度和广度信息反馈概念隶属度的思想, 定量分析术语与领域的隶属程度, 进行本体概念的领域隶属度检查, 完成领域本体概念的提取。实验结果表明, 该方法提高了领域本体概念的提取效率和准确率, 具有可行性和合理性, 领域本体概念的提取准确率提高了12%左右。  相似文献   

10.
基于概念检索的中文搜索引擎研究   总被引:2,自引:0,他引:2  
在Internet高速发展的信息时代,网络搜索引擎是人们快速获得信息的重要工具之一.然而由于传统的搜索引擎基本上都是采用基于关键词匹配的全文检索技术,导致检索结果不全、无关信息过多.本文给出了一种基于概念检索的中文搜索引擎模型,采用"以网对网"技术来实现概念检索,使搜索引擎从基于关键词的检索提高到基于知识的智能检索.基于概念检索的中文搜索引擎对知识有一定的理解和处理能力,在一定程度上提高了搜索引擎的智能化.  相似文献   

11.
基于同义词词林的中文文本主题词提取   总被引:3,自引:0,他引:3  
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本  相似文献   

12.
关键词在自然语言处理的各个领域有着十分重要的意义.对于中文自然语言处理,一词多义和多词一义问题始终是困扰研究人员的一个重大难题.传统的一些基于统计的方法,诸如KEA只是机械地统计了词频,而没有考虑词之间的关系.文中提出了一种基于同义词的中文关键词提取方法SKEA,并建立一阶隐马尔可夫模型进行词义消歧,将文本从稀疏的词空间映射到语义空间,从而实现了文本的降维.同时改进了KEA的位置权重公式,并提出新的关键词特征选取项.最后对SKEA方法和KEA方法进行比较实验,证明SKEA是一种更优秀的中文关键词提取方法.  相似文献   

13.
In Chinese question answering system, because there is more semantic relation in questions than that in query words, the precision can be improved by expanding query while using natural language questions to retrieve documents. This paper proposes a new approach to query expansion based on semantics and statistics Firstly automatic relevance feedback method is used to generate a candidate expansion word set. Then the expanded query words are selected from the set based on the semantic similarity and seman- tic relevancy between the candidate words and the original words. Experiments show the new approach is effective for Web retrieval and out-performs the conventional expansion approaches.  相似文献   

14.
基于ALICE的汉语自然语言接口   总被引:10,自引:1,他引:9  
分析人工智能聊天机器人ALICE的知识组织结构和推理机制,研究ALICE在处理汉语时需要解决的问题,提出利用语义语法扩展知识描述语言AIML的表达能力.采用不确定性推理进行模式搜索并对结果打分择优和答案动态提取,基于ALICE设计实现了一个汉语自然语言接口--CNLIS,系统结构与具体领域无关.实验结果表明,该接口移植方便,准确率和召回率可分别达到91.45%和91.70%.  相似文献   

15.
针对诉讼案件违法事实要素抽取效果依赖领域专业知识的特点,提出一种基于transformer双向编码器表示(bidirec-tional encoder representations from transformer,BERT)的诉讼案件违法事实要素自动抽取方法.首先,通过构建领域知识并采用谷歌BERT预训练语言模型进行训练得到拟合诉讼案件领域数据的模型参数和中文预训练字嵌入向量作为模型的输入,得到具有上下文相关的语义表示,以提高词嵌入的上下文语义质量.其次,采用循环卷积神经网络对文本进行编码并获取在文本分类任务中扮演关键角色的信息,提升案件违法事实要素抽取的效果.最后,采用focal函数作为损失函数关注难以区分的样本.违法事实要素抽取的工作是通过对文本标签进行分类得到的.实验测试表明,该方法对诉讼案件要素抽取的F1值为86.41%,相比其他方法性能均有提高.对模型注入领域内知识,也可以提高模型抽取准确率.  相似文献   

16.
运用生成词库理论实施现代汉语教学,符合汉语语义型类型特点,适应学生知识水平结构,更重要的是,它打破了传统的割裂式教学模式,由物性结构这一中心出发,延伸辐射到字、词、句等汉语教学的各个层面,化零为整,化繁为简,形成有序的知识系统,不仅有利于提高学生的创新能力和使用信息化手段的能力,而且有利于强化学生自我获取知识和更新知识的能力,从而更大程度地提高教学效率。  相似文献   

17.
采用Ontology作为一种能在知识和语义层次上描述信息的概念建模工具,根据Ontology具有的良好的概念层次结构和对逻辑推理功能的支持,提出新的概念匹配算法,突破了传统的基于关键字的检索技术,把查询请求定位到相关的社区,因此能得到满意的结果.  相似文献   

18.
知识获取技术制约着知识系统的研究和应用,有效地从文本中提取领域知识成为知识获取的重要途径.本文提出了基于本体和图分析的领域知识获取技术,分析了本体数据结构、本体概念的实例化以及基于图分析的语义场构造方法.建立了具有广泛适用性的文本知识获取系统框架,实现了原型系统.通过针对中医医案的中医领域知识获取实验验证,取得了较好的效果.  相似文献   

19.
针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性和命名实体信息,并通过梯度反转(gradient reversal layer,GRL),实现有标注汉语和无标注越南语之间的对抗训练,将从大量汉语新闻文本中学到的语言无关的事件类型特征融入到联合特征提取器中,进行汉越跨语言的无触发词事件检测,缓解越南语的数据稀缺和触发词的局限性。实验中提出的方法较最好的基线模型在准确率上提升了4.32%。  相似文献   

20.
现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号