首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
在特定领域问答系统中,领域知识直接影响问答效果.本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候选段落.对于定义性问题,结合关键词加权权重计算方法及句子与问题语义相似度方法,对候选段落或句子与问题相关度排序,提取相关度高的句子或段落作为答案,对于数词或列表性实体问题,借助命名实体识别,提取与问题中心相关的领域实体作为答案.在云南旅游领域进行了答案提取实验,结果表明该方法具有较好的效果.  相似文献   

2.
设计从自然语言问句到结构化查询的转换框架。该方法从自然语言问句的句法结构入手, 提出一套启发式识别实体与关系的方法, 并利用语料库建立从实体到知识库的映射, 对谓词进行消歧, 进而转化为计算机可理解的结构化查询语言。从百度知道抽取人物、地点、组织3类共 42 个问题作为标准测试集。实验结果表明, 所提出的框架能够有效地将中文自然语言问句转换为结构化查询, 为下一代智能问答系统打下良好的基础。  相似文献   

3.
银行领域汉语自动问答系统BAQS的研究与实现   总被引:13,自引:2,他引:13  
介绍BAQS的研究背景和系统框架.探讨基于问点块和语义块识别以及句模匹配分析问句的新方法,并用向量表示整个问句语义.借鉴本体和知网思想,构建银行领域本体库和银行知网.采用预先对金融领域实用文本进行标注,依据问句向量从标注树中提取答案.并针对某银行实现汉语自动问答系统.实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值.  相似文献   

4.
针对高校校园这一应用领域,设计并实现了一种基于多层策略的校园问答系统.提出了校园知识的3种类型,即服务型知识、常见问题型知识及文本检索型知识.针对不同类型的知识,建立了特定服务查询、常见问题查询和自由文本检索多级策略的问答系统模型,逐级匹配查询问句的答案:特定服务查询通过模式匹配将问句转换为服务接口;常见问题查询通过特征关键词提取、问题分类和问句相似度计算算法将问句与常见问题库中的问题-答案对匹配;自由文本检索对全文检索引擎solr返回的候选文档进行答案抽取,获取答案段落.性能测试表明:对80%以上的查询问句,若问题相关知识存在于系统中,则系统都能给出满意的答案.  相似文献   

5.
随着人工智能的发展成熟,教育知识问答系统的实现成为相关专家共同研究的热门话题.此次研究设计了一种教育知识问答系统算法框架并提出基于BiLSTM+CNN-CRF算法的实体识别模型,通过CNN模块和BiLSTM模块完成局部特征和全局特征的拼接,最终经全连接层和CRF模块完成解码,通过最佳序列标注实现问答系统问句分析.设置超参数中学习率为0.01,dropout为0.1,迭代轮数为50,滤波器数量为6时,实体识别模型中的性能更佳.BiL-STM+CNN-CRF实体识别模型比LSTM-CRF和BiLSTM-CRF两种模型的F1值分别提升3.04%和0.62%,准确率分别提升0.77%和0.73%,召回率分别提升5.18%和0.62%.  相似文献   

6.
针对已有主观题评卷存在的不足,本文提出了一种改进的综合语义技术与LSTM神经网络的主观题自适应评卷方法。首先,通过构建LSTM神经网络分类模型实现对问句试题语料集的题目类型和疑问类型同步双分类,为实现不同的问句类型采用不同的主观题自动评卷方法提供前期保障;然后,结合句法分析和依存关系分析对题目和答案文本进行剖析,包括通过对题目的依存关系分析得到疑问词在问句中的成分,再结合依存关系对答案进行剖析,得到标准答案和学生答案中各自的核心语义、非核心语义和否定语气词;最后,根据不同的问句类型,采用不同的主观题自动评卷方法,实现同一标准答案的不同学生回答方式的自适应评卷,提高主观题智能评卷的灵活性和准确性。  相似文献   

7.
为解决侨情问句甚少导致训练的侨情语料较少的问题,提出一种基于模板学习的智能侨情问句生成方法。首先,对侨情篇章文本进行包含主题、关系、对象的三元组抽取;其次,构建训练数据集,输入数据由主题和关系构成,输出数据为问句模板;随后,采用以BERT+LSTM+Attention为核心算法的seq2seq框架,实现问句模板生成;最后,对模板问句进行主题文本替换,从而得到最终的实例化问句。采用BLEU,ROUGE-N,公开问答系统评测及人工评价方式对文中方法进行评价。结果表明:BLEU,ROUGE-N,公开问答系统评测及人工评价方式对文中方法的评测结果分别为0.77,0.67,81%,88%,较基线模型有较大的提升。  相似文献   

8.
本体问答系统需要实现从自然语言问句到本体查询语句的转换,目前的解决方法主要有自然语言接口和问句相似度方法。针对现有问句相似度方法在本体问答系统中应用的不足,设计了改进的相似度计算方法。通过建立常问问题的查询模式集合,综合考虑问句的统计、语义、结构特征计算目标问句的相似度,分别以自动选择和用户交互两种方式选择目标问句的查询模式,并将其转换成实际SPARQL查询语句,最终检索本体及抽取出答案。两种方式的准确率分别为83.8%和92.1%。  相似文献   

9.
属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力。本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能。本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%。  相似文献   

10.
模式匹配在中文问答系统中的应用研究   总被引:2,自引:0,他引:2  
针对汉语文本,对自动问答系统的实现进行了初步探索,主要是基于向量空间模型对文档信息进行检索,重点研究了模式匹配在判断问句类型和获取答案方面的作用,设计并初步实现了一个面向受限领域内中文自动问答系统。  相似文献   

11.
当前的旅游咨询服务还只是为用户提供自主网络搜索返回的碎片化信息,尚未能将地方特色文化智能反馈给用户。针对此实际情况,本研究基于广西民族文化旅游知识图谱,对广西民族文化旅游问答系统的关键技术加以研究,并设计相应的问答系统,在解决实际需求的同时,尝试提高用户咨询体验满意度。根据问答系统(Question Answering System,QA)结构,本研究设计并实现了基于BERT的命名实体识别模块(BERT based Entity_identification Model,BEiM),基于模版的关系抽取模块(Template based Relationship_extraction Module,TReM)和基于知识图谱的匹配推理模块(Knowledge Graph based Matching Module,KGMM)。在上述关键技术基础上,实现了广西文化旅游问答系统,并给出相关实验测试和应用效果。本研究构建的知识问答系统能够帮助游客高效地找到当地旅游的相关知识,提高游客自助服务的效率。对于人工智能助力广西旅游业的发展而言,本研究无疑是一项具有重要意义的工作。  相似文献   

12.
为有效普及小学生安全出行的交通规则及出行常识、从出行源上科学降低小学生交通事故发生率,基于Android平台并借助AndroidStudio开发工具,开发面向小学生交通安全出行的智能问答系统。在对智能问答系统的基本功能、运行实现原则、辅助功能等进行细致分析的基础上,设计智能问答系统的逻辑框架和物理框架;在此基础上,分析智能问答系统的开发语言环境与关键技术,设计智能问答系统的实现步骤与程序;最后,优化设计智能问答系统运行主界面、启动界面、桌面图标,并通过盐城市亭湖区某实验小学的推广应用,表明设计的智能问答系统不仅可以提高小学生学习交通安全知识的兴趣,还可以较为流畅、准确地实现与小学生的正常对话以及交通安全出行问答,有利于降低小学生交通事故发生率。  相似文献   

13.
基于问题模式匹配的智能答疑系统原型   总被引:2,自引:0,他引:2  
智能答疑系统是将学生的问题和老师的解答有机地组织起来并存放至相应的答题库中,通过自然语言的语义理解技术来分析并自动的匹配学生所提出的问题,自动地给予问题解答的系统. 智能答疑系统能够给予提问者即时的回应,减轻教学人员的工作压力,在远程教学中具有重要意义.红棉智能答疑系统(原型系统)针对国内现有的智能答疑系统普遍存在的问题,借鉴了国外先进智能答疑系统的成功经验与设计理念,根据中文智能答疑的特殊需求,引入了基于概率的双向最大匹配分词算法、智能问题模式匹配、基于语义依存树的语义分析等技术进行智能问题分析,形成了具有更高答案召回率、合理性与正确性的新一代智能答疑系统.  相似文献   

14.
特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri-BiLSTM-CNN的深度学习模型。首先,将双向长短期记忆网络和卷积神经网络结合构建网络模型,综合利用了BiLSTM处理序列化数据的优势和CNN捕获局部特征的优势。然后,采用Triplet并列式排列结构进行句子之间的匹配。最后,使用字向量替代词向量,避免了分词错误对模型的影响。在钻井安全领域的真实数据集上进行实验验证,结果表明,Tri-BiLSTM-CNN模型能更好地对句子语义进行向量化表征,显著提升句子相似度计算的准确率,而且效果明显优于CNN和LSTM两种网络结构。将该模型用于钻井安全领域的FAQ问答系统中,有效减少了人工成本,对改善钻井工作的效率和质量具有重要意义和应用价值。  相似文献   

15.
刘继明  孙成  袁野 《科学技术与工程》2021,21(18):7635-7641
为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果 表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53%,即可为增强事件实体信息抽取提供实践意义.  相似文献   

16.
基于多级检索的自动问答系统研究   总被引:1,自引:0,他引:1  
问答系统通过采用自然语言处理技术,用简洁准确的语言回答用户用自然语言提出的问题。文中设计并实现了一种基于本地知识库和网络检索的中文问答系统,利用知识共享平台构建大规模的真实用户问题知识库,通过对知识库和网络资源的多级检索,使用句法分析和实体识别对答案进行抽取,有效提高了问答系统的响应速度和准确率。  相似文献   

17.
汉字是象形文字,其字形特征对于中文命名实体识别有着重要的作用。针对双向长短期记忆模型(bi-directional long short-term memory,BiLSTM)提取部首,命名实体识别准确率不高的问题,提出笔画组成编码器,用于获取汉字的字形特征,并将笔画字形特征向量和预训练的语言表征模型(bidirectional encoder representation from transformers,BERT)输出的字向量进行拼接,将拼接后的向量放入双向长短期记忆模型与条件随机场(conditional random field,CRF)相连的标注模型(BiLSTM-CRF)中进行命名实体识别。实验表明,所提的方法在Resume数据集上命名实体识别准确率有显著提升。相较于用卷积神经网络做编码器提取汉字字形特征,准确率高出0.4%。相较于使用BiLSTM提取的部首特征模型和加入词典的长短期记忆模型(Lattice LSTM)模型其准确率分别提升了4.2%、0.8%。  相似文献   

18.
Network texts have become important carriers of cybersecurity information on the Internet. These texts include the latest security events such as vulnerability exploitations, attack discoveries, advanced persistent threats,and so on. Extracting cybersecurity entities from these unstructured texts is a critical and fundamental task in many cybersecurity applications. However, most Named Entity Recognition(NER) models are suitable only for general fields, and there has been little research focusing on cybersecurity entity extraction in the security domain. To this end, in this paper, we propose a novel cybersecurity entity identification model based on Bidirectional Long Short-Term Memory with Conditional Random Fields(Bi-LSTM with CRF) to extract security-related concepts and entities from unstructured text. This model, which we have named XBi LSTM-CRF, consists of a word-embedding layer, a bidirectional LSTM layer, and a CRF layer, and concatenates X input with bidirectional LSTM output. Via extensive experiments on an open-source dataset containing an office security bulletin, security blogs, and the Common Vulnerabilities and Exposures list, we demonstrate that XBi LSTM-CRF achieves better cybersecurity entity extraction than state-of-the-art models.  相似文献   

19.
FAQ (frequently asked question) is widely used on the Internet, but most FAQ's asking and answering are not automatic. This paper introduces the design and imple mentation of a FAQ automatic return system based on semantic similarity computation, including computation model choo sing, FAQ characters analyzing, FAQ data formal expressing, feature vector indexing, and weight computing and so on. According to FAQ features of sentence length short, two mapping, strong domain characteristics etc. Vector Space Model with special semantic process was selected in system, and corresponding algorithm of similarity computation was proposed too. Experiment shows that the system has a good performance for high frequent and common questions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号