首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 100 毫秒
1.
从问句分析、信息检索和答案抽取3个环节介绍了基于本体的网络问答式语义检索系统的基本原理及技术方案,描绘了该项目的应用服务以及发展前景。  相似文献   

2.
介绍了有关中文问答系统的一些研究.问答系统是集知识表示、信息检索、自然语言处理技术于一体的难度很高的研究课题.本文从问题处理、检索系统、答案抽取三个方面进行了详细说明.  相似文献   

3.
中文问答系统的研究   总被引:1,自引:0,他引:1  
介绍了有关中文问答系统的一些研究.问答系统是集知识表示、信息检索、自然语言处理技术于一体的难度很高的研究课题,本文从问题处理、检索系统、答案抽取三个方面进行了详细说明.  相似文献   

4.
随着互联网的迅速发展和Web2.0概念的提出,问答系统以直接返回给用户精确的答案而逐渐成为一种新的信息检索技术.由于问句都是自然语言的形式,涉及到对问句的语义理解及相似度的判断.本文提出了一种基于问句的表层和语义相似度计算方法,通过聚类去除冗余信息,再通过熵的特征计算权值,最后融合多种特征计算问句相似度,进行答案抽取....  相似文献   

5.
提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取.在旅游领域进行实体答案抽取实验,取得了较好的效果,其中召回率达88.78%,准确率达86.04%.  相似文献   

6.
针对传统问答系统答案抽取方式对答案片段的分词和上下文语义理解准确性的依赖严重,抽取过程耗费大量的人力和时间的问题,提出采用分步抽取答案的方法,先从答案片段中抽取包含答案的句子,再从提取的答案句中进行最终答案的抽取方式。在答案句抽取过程中使用Bi-LSTM( Bi-directional Long Short-Term Memory)和Max Pooling 结合的方法构建答案句抽取模型。实验结果表明,在答案句的抽取中,该模型的MRR( Mean Average Precision) 指数接近0. 75。  相似文献   

7.
自动问答系统研究综述   总被引:2,自引:0,他引:2  
自动问答系统是自然语言处理领域中一个非常热门的研究方向,它综合运用了多种自然语言处理技术。本文综述了国内外自动问答技术的发展现状,对系统三个主要组成部分:问题分析、信息检索和答案抽取进行了深入的分析,通过比较,得出了自动问答系统运用各类技术之间的优势与不足。在此基础上,提出了自动问答系统的发展方向。  相似文献   

8.
随着互联网技术的快速发展,Web信息呈现爆炸性增长,人们发现用信息检索的方法不能及时的得到想要的信息,于是出现了信息抽取,Web信息抽取是指从Web文档中自动抽取感兴趣信息的过程。本文主要介绍Web信息抽取的研究现状及抽取工具和抽取方法。  相似文献   

9.
E-learning环境下的异步答疑系统的研究   总被引:1,自引:0,他引:1  
目前E-learning环境下常用的异步答疑算法存在实现复杂、时间代价消耗高的问题,介绍了基于答案的关键字和权值进行信息检索的算法.使用此算法,教师不仅能够为学习者提供文本资料,还可以提供其他的比如视频、音频和图片等资料,教师只需要为相应的答案提供一些参考关键字和设定权值即可.因为学习者抽取答案的关键字的能力是有限的,由教师来做此工作更加合适.试验证明此算法实现容易,查找效率高,能够较好地满足E-learning环境下的异步答疑的需求.  相似文献   

10.
中文信息自动抽取   总被引:16,自引:0,他引:16  
论述了信息抽取与信息检索的区别,信息抽取与深入的自然语言处理的区别,中文信息自动抽取的目的、任务和基本模型;然后介绍了一些国外的IE系统;讨论了关于中文信息自动抽取的一些问题和正在开展的中文信息抽取研究工作。  相似文献   

11.
针对当前信息检索服务中存在的固有缺陷,提出了一种基于用户桌面信息抽取的个性化推荐方法.详细介绍了通过用户桌面资源信息抽取建立长期用户模型,以及通过工作场景信息抽取建立短期用户模型的算法.长期用户模型提供了完整全面的用户兴趣偏好信息,短期用户模型则为预测用户当前信息需求提供了依据.实验结果表明,基于用户桌面信息抽取的个性化推荐服务能较好地预测用户当前需求、具有良好的推荐效果.  相似文献   

12.
文章全面介绍了网络信息检索的概念、方法,影响网络信息检索的因素、提高网络信息检索效率的方法,还讲述了网络信息检索未来发展趋势。  相似文献   

13.
新词识别是中文信息处理领域中的一个难点,也是自然语言处理、信息检索和机器翻译等领域的一项基础研究.根据新词特点提出不限领域的基于概率统计技术和规则方法相结合的概念抽取方法,比较了规则和统计结合的方法与纯统计的新词识别方法,通过增加权重设置很好地结合了两种方案.  相似文献   

14.
在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务,设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算,提出通过使用卷积神经网络表示句子语义和计算相似性,同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明,所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比,使用卷积神经网络能够更好地描述句子语义,计算问题和句子之间的相似性,有效地改善答案摘要的质量。  相似文献   

15.
基于本体的受限领域问答系统研究   总被引:1,自引:1,他引:0  
鉴于使用本体表示知识利于知识的重用及推理,提出基于本体知识库的受限领域问答系统(QA)框架,该框架可以方便地根据本体知识库和问句语义表征抽取答案.定义了本体的结构,以某医疗领域的本体为例分析本体元素之间的抽象关系;描述问句语义分析的方法,给出答案抽取的相关技术;分析问句类型,给出对应的问句语义表征和答案抽取策略.以某医疗领域的问答系统为实验平台,封闭测试F值为83.86%,开放测试F值为76.04%,效果良好.  相似文献   

16.
Web信息抽取与语义检索框架   总被引:1,自引:1,他引:0  
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统.  相似文献   

17.
提出了一种利用多主体理论设计的信息采集系统ICS.它利用现有搜索引擎搜集回应者(能够提供查询问题答案的网络用户)的电子邮箱地址,将查询问题通过电子邮件发送给回应者,并收集回应者提供的答案,经过处理后提交给用户,从而将静态的信息检索变为用户之间动态的对话.试验证实,该系统能够提供复杂查询的答案.  相似文献   

18.
抽取式阅读理解是自然语言处理的重要任务,需要机器在阅读理解自然语言文本的基础上,从中抽取给定问题的答案(输入文本中的片段),并在问题不可回答时拒绝回答.这种不可回答情况的存在使机器阅读理解更具有挑战性,特别是在输入文本含有似是而非文本片段时,现有模型很容易将这样的片段混淆为问题答案,进而错误判断问题的可回答性.为了进一步提高抽取式机器阅读理解模型的效果,本文将SQuAD 2.0数据集中的似是而非答案看成对抗样本,将其既作为答案文本片段抽取的正例,也作为问题可回答性的负例,在现有模型答案交叉熵损失的基础上增加排序损失.在SQuAD 2.0上进行的实验表明,本文方法可以提高现有模型的阅读理解能力,明显提升可回答性判断及答案文本片段抽取的效果.  相似文献   

19.
介绍文献信息检索技术的发展过程,分析了网络文献信息检索的技术方法,研究了基于内容的多媒体信息检索技术及其图像检索关键技术并探讨了文献信息检索的发展方向。  相似文献   

20.
面向财税领域非事实型问题, 提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注, 引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选, 并从相似案例中抽取相应答案。在真实数据集上的测试结果表明, 该方法在准确率和效率上比基准方法有显著提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号