首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
阅读理解系统是一种特殊的复杂问答系统,问题分析是重要的组成部分,对后续答题起着至关重要的作用。针对高考文学类阅读理解复杂选择题的选项分类进行研究,将选项看作短文本,对选项的类别标签进行了定义,引入依存语义和情感语义等多种特征对选项进行建模,使用多标签分类算法对选项进行分类,在语义层面上为阅读理解选择题的进一步解答奠定基础。  相似文献   

2.
利用选择类问题具有明确候选项的特点, 简化问题分类过程, 并针对长文本语义蕴含短文本语义的语言现象, 提出一种根据文本蕴含强度大小对候选答案进行排序的方法。在没有大规模问答对的情况下, 采用维基百科中文语料库, 以全国各省市高考地理选择题作为实验数据, 通过句子相似度和文本蕴含两种方法来解答地理选择题。实验表明, 基于文本蕴含方法的准确率为36.93%, 比基于词嵌入的句子相似度方法提高2.44%, 比基于向量空间模型的句子相似度方法提高7.66%, 验证了该文本蕴含强度计算方法的有效性。  相似文献   

3.
针对高考语文阅读理解,文章通过对题干、篇章句子片段、选项三者的关系进行建模,提出一种基于题干与选项一致性判别模型的阅读理解答案预测方法。模型由篇章句子与题干的相关度和对选项的支持度进行选项置信度度量,并基于这两个度量定义了联合打分函数。其中相关度通过题干定位到的原文出处与句子片段的距离来度量,支持度通过句子相似度特征、反义匹配特征、否定特征三个语义特征来度量。同时,在近10年的高考真题和模拟题中分别进行了三组实验,实验结果给出了该方法在不同特征组合和参数设置上的答题效果。  相似文献   

4.
针对阅读理解选择题中因果关系类选项,该文提出了基于因果关系网的因果关系支持度分析方法。首先,通过线索短语从阅读材料中抽取因果事件对,并计算事件对之间因果关联强度,综合利用抽取到的因果事件对与其对应的因果关联强度构成因果关系网;其次,综合考虑了选项中的每个词在文档中的重要性和整个文档中的区分能力,采用词频-逆向文件频率(term frequency-inverse document frequency,TF-IDF)方法分别从原文中检索与选项中因事件和果事件相关的句子;最后,基于因果关系网和抽取到的相关句计算选项的因果关系支持度。为了验证该方法,实验采用了769篇模拟材料和13篇北京高考语文试卷材料(包括原文与选择题)作为测试数据集,实验结果表明该方法的准确率比Baseline方法提高了约11%。  相似文献   

5.
张涛 《科技信息》2012,(12):326-326
高考试卷中选择题每年都占有很大比重,该类题型不需要运算过程,只要根据题目条件,从给出的四个选项中,选出一个正确选项即可。如何在竞争激烈的高考中,既准确、巧妙,又全面、快速的解答好选择题,往往决定高考成败。笔者结合2011年全国及一些省市高考选择题,例谈了几种解决选择题的方法,以期对读者有所启示。  相似文献   

6.
传统的TF-IDF算法主要依赖词频,往往忽略词语语义和一些具有重要意义的副词。针对这一问题,提出了一种基于语义分析的改进TF-IDF算法。该方法融入了词语语义来计算词频,改进了反义词语之间的相似度。实验结果表明,该方法在计算句子相似度中能根据语义方向对句中各词语词频进行统计,同时判断整个句子语义方向,与传统算法比较,语句相似度的准确性提高了5. 7%。  相似文献   

7.
藏文框架语义知识语义关系分析的关键就是建立句子中各词语之间的语义关联关系,实现各框架间知识的共享,获取更多的信息.文章引出了藏文框架语义知识、框架及框架元素并结合实例分析了以藏语句子为主,组成该句子的词语或短语间的语义关系及框架形式表示该句子的语义为结构化.  相似文献   

8.
基于本体的英汉翻译记忆系统的研究   总被引:1,自引:0,他引:1  
在翻译记忆系统中,句子的语义理解是提高相似句子的匹配率的关键.提出了一种基于本体的英汉翻译记忆系统模型,以计算机文献领域的专业术语为范围构建了一个知识本体CSO,并引入本体的概念相似度进行模糊词对的相似度计算.实验证明,本体的语义信息能提高系统的匹配率.  相似文献   

9.
句子语义距离计算在许多智能系统中发挥着重要的作用.针对句子语义知识的表达方式、语义框架,提出一种基于语义同构的语义距离算法,通过计算代表句子语义的两个语义框架的最大同构子框架和最大包容子框架,计算句子的语义距离,并且通过动态调整句子成分的权重,提高算法的有效性.实验证明,该算法可以使语义距离计算精确率达到97.7%,与现有方法相比具有更高的精确度.  相似文献   

10.
为提高口语对话系统中语言理解的稳健性,提出了一种基于最大后验统计框架的两级搜索的理解算法.第一级用概念捆绑达到提取句中关键成分并剔除某些干扰成分的目的; 第二级采用改进的基于树扩展的稳健句法分析搜索最佳理解结果,同时引入用户意图推断和句子特征短语两方面的信息对搜索空间进行约束,进一步提高了理解的稳健性和实时率.实验表明,该算法应用于火车信息查询领域,在0.22倍实时下,能得到13.6%的句意理解错误率和25.4%的概念理解错误率,相对基线系统分别为降低了23.2%和9.3%.  相似文献   

11.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

12.
为从海量微博中高效地获取不同话题下的关键信息,微博观点摘要成为自然语言处理领域近期研究的热点之一。基线方法基于TF-IDF算法抽取微博句中的关键词,并据此计算微博的重要性分数,直接筛选出观点摘要;朴素改进方法在基线方法的基础上,增加了情感分类步骤,并利用微博句之间的语义距离,将摘要句候选集中语义重复、重要度较小的句子去除,生成观点摘要;基于语义图优化算法的方法在朴素改进方法的基础上,利用微博句的重要性分数及微博句之间的语义距离构建语义图结构,并通过图优化算法筛选出观点摘要。朴素改进方法在COAE2016评测任务一测试数据集上,10个话题的平均ROUGE-1值达到26.39%,平均ROUGE-2值达到0.68%,平均ROUGE-SU4值达到5.69%,且评测官方公布结果显示,该方法在9项评价指标中获得6项最佳性能。基于语义图优化算法的方法在评测样例数据集上进行了实验,结果显示,该方法比朴素改进方法在ROUGE-1,ROUGE-2,ROUGE-SU4值上分别提升了0.63%, 1.51%, 2.69%。  相似文献   

13.
基于本体的语义相似性研究   总被引:2,自引:2,他引:0  
李文超  杨妮妮 《科学技术与工程》2012,12(21):5328-5330,5336
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

14.
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

15.
基于指纹和语义特征的文档复制检测方法   总被引:1,自引:0,他引:1  
文档复制检测是保护知识产权、提高信息检索效率的有效手段.提出一种基于指纹和语义特征的文档复制检测方法.介绍了指纹提取算法以及相关的重叠度度量,并且以知网的概念描述为基础对文本进行语义分析,利用词类信息和语义规则进行歧义消解,并采用基于框架的层级表示方法描述句子的语义特征.在3种测试集上把该方法与现存的方法在检测准确率上进行比较,实验结果表明该方法能够有效地检测出各种方式的复制文本.  相似文献   

16.
大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息.此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关.基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一...  相似文献   

17.
目前的抽取式单文档摘要方法未考虑原文中句子和原文语义信息相关度,针对该问题,提出一种基于语义空间的抽取式单文档摘要方法.首先,利用Word2Vec训练词向量以获取语义空间,并基于该语义空间表示句子和原文;然后,基于余弦相似度计算句子与原文相似度值,并使用TextRank和词频-逆文本频率指数(TF-IDF)模型计算原文中句子的权重;最后,将相似度值与权重相结合得到句子的最终权重值.实验结果表明,该模型摘要质量优于基于深度学习的基线系统.  相似文献   

18.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

19.
在情感计算中,提取情感关键句是简化分类过程、提高分类正确率的关键环节.近年来,人们的社交需求日趋旺盛,表情符相较于文字具有更为丰富的语义信息,在各交流系统中得以广泛应用.为提升情感关键句提取方法的性能,对表情符的情感极性进行深入分析,提出一种基于表情符分析的情感关键句提取方法.首先统计表情符的情感极性,再将其和纯文字句子情感极性进行对比分析,对于句子中词组的情感极性不一致的句子将采用类序列规则挖掘,得出句子的最终情感极性;然后再结合位置信息以及关键词等属性特征,作为衡量该句是否为情感关键句的重要依据;通过对比实验验证了所提方法相较于现有方法在正确率和召回率方面都有较大提高.  相似文献   

20.
MMT模型用于语篇语义理解的语段划分   总被引:1,自引:0,他引:1  
文章首先分析了自然语言理解中篇章语义理解的重要性,在此基础上提出了一种用于语篇语义理解的语段划分方法.该方法是在已分词的篇章语句中,引用冯志伟的汉语句子的多叉多标记树模型,在单句语义理解基础上,将语篇划分为各个语段,找出各语段间的层次关系,为语段内句子间意义分析做准备,最终达到篇章语义理解的目标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号