首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
鉴于互联网上各种不良网页的影响,提出了一种使用贝叶斯分类算法和领域本体过滤中文网页的方法。 该方法根据正反例领域网页计算领域特征词的权重,建立领域特征词库并制作领域本体,根据正例领域网页得到本体元素权重库;使用贝叶斯分类算法得到候选网页;根据领域本体对候选网页进行语义相关度计算并进行网页过滤。 该方法可以区分相同领域网页中的正反例网页并可兼顾网页过滤的实时性。 通过游戏领域网页的测试,准确率和召回率均在98%以上, 语义分析游戏相关网页的平均时间为1~2 s, 对用户浏览网页速度的影响较小, 效果令人满意。   相似文献   

2.
随着网络上服务资源的规模化增长,如何帮助用户找到所需服务是一个关键问题.研究发现领域本体的构建可帮助用户有效解决该问题,而已有的一些构建方法一般依靠人工,费时费力.针对该问题,提出一种基于关联规则和K-means的领域本体构建方法.该方法首先利用支持向量机进行面向领域的服务分类,从分类得到的领域知识中选取初始领域概念;然后根据关联规则和K-means算法挖掘概念间关系,以得到初始领域本体,并使用Wordnet对其进行语义丰富.最后,通过ProgrammableWeb网站提供的真实服务集进行实验验证.实验结果表明所提出的领域本体构建方法能够识别概念间关系,进而为Web服务语义查询提供相应支持.  相似文献   

3.
基于领域本体的自动化语义标注方法的研究   总被引:1,自引:0,他引:1  
介绍了语义网,本体以及语义标注的基本概念,对现有的语义标注方法以及技术进行了说明和分析.针对目前互联网上含有大量语义信息的HTML文档,提出了一种自动化的语义标注的方法.该方法对HTML文档进行结构分析,并参照词汇数据库Hownet和领域本体对文档进行语义分析,找出文档对应的语义分类树,给文档加上语义标签.以电子消费品领域的HTML文档为实验对象,实验结果证明了该方法具有一定的可行性.  相似文献   

4.
顾及到地理领域语义相似度计算模型考虑因素过于单一、主观性较强等问题,针对本体模型的结构特点,提出一种计算节点密度的新方法,并从模型概念间的关系类型、节点密度、节点深度等方面分析本体概念相似度的计算,将其归并为距离因素.基于本体层次网络结构计算语义信息量,该方法不依赖于专家经验,具有客观性.结合语义距离、信息量、属性等影响相似度的因素,提出一种计算概念问语义相似度的综合算法,该算法考虑到不同的影响因子在语义相似度计算中的重要程度不同,从而赋予地理本体关系不同的权值.通过对土地利用分类中实体的语义相似度进行实例验证,表明提出的算法能有效改善语义相似度计算的准确性和有效性,能够获得更符合认知的信息检索结果.  相似文献   

5.
基于本体的受限领域问答系统研究   总被引:1,自引:1,他引:0  
鉴于使用本体表示知识利于知识的重用及推理,提出基于本体知识库的受限领域问答系统(QA)框架,该框架可以方便地根据本体知识库和问句语义表征抽取答案.定义了本体的结构,以某医疗领域的本体为例分析本体元素之间的抽象关系;描述问句语义分析的方法,给出答案抽取的相关技术;分析问句类型,给出对应的问句语义表征和答案抽取策略.以某医疗领域的问答系统为实验平台,封闭测试F值为83.86%,开放测试F值为76.04%,效果良好.  相似文献   

6.
分析并构建唐卡领域本体,以实现基于语义的唐卡图像标注与检索.在唐卡领域专家的指导下分析唐卡的分类体系,给出唐卡本体相关的定义和公理,定义了相关概念、对象、属性、实例及约束条件,并基于Protégé构建了唐卡领域本体.最后对其进行一致性分析,实现了基于语义的唐卡知识库查询,进一步验证了所构建唐卡领域本体的合理性.  相似文献   

7.
分析了目前航海信息领域在数据共享和互操作上存在的问题 .航海信息领域中不同的组织和机构对知识和信息的不同理解或不同的表达格式 ,严重地影响了相互之间的信息共享和互操作 .针对这些问题 ,在分析本体作用的基础上 ,指出了在航海信息领域中建立清晰描述概念及概念之间关系的概念模型 ,即航海信息本体的必要性和重要性 .一个共享的航海信息本体将清晰航海信息领域的知识结构 ,促进不同组织结构之间的数据共享和互操作 ,并为智能航海信息系统和领域的语义网络的构建打下基础 .最后 ,对航海信息本体的构建进行了探索性的研究 ,提出了一个航海信息本体构建的方法框架  相似文献   

8.
针对传统道路交通事件语义解释方法依赖于定量数学建模方法,且底层语义概念与高级事件表达之间存在语义鸿沟的问题,提出了基于动态描述逻辑框架的事件语义定性表达和推理新方法.首先,对静态道路场景信息进行分类标记,构建交通领域本体模型,给出了本体知识库实时修改算法;其次,基于动态描述逻辑的动作公理,提出了描述车辆运动变化的运动模式集,实现了对一定约束条件下车辆机动能力范畴的刻画;最后,将事件语义解释过程抽象简化为目标的实现过程,提出了子目标生成以及实现规则,达到了依据交通事件语义解释交通态势变化过程的目的.实验结果表明:领域本体知识库的定义明确,拥有统一的框架结构,便于理解,且具有通用性;动态描述逻辑良好的表达和推理能力增强了事件语义描述的可靠性,较好地解决了语义鸿沟问题.  相似文献   

9.
 语义网的出现给个人隐私的使用和管理带来新的挑战,需要开发出合适的本体来解决电子商务领域中对隐私表达和使用描述不一致的问题.基于本体论的方法探讨隐私领域本体的建立,具体介绍了本体的建立原则和方法,并利用OWL给出隐私本体的体系结构.同时,给出隐私本体在语义Web中的应用示例.该本体的建立让隐私知识实现重用、共享和处理,为今后研究语义Web中的隐私保护技术奠定了理论基础.  相似文献   

10.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

11.
基于支持向量机的汉语问句分类   总被引:5,自引:0,他引:5  
目前汉语问句分类一般都依据疑问词及其相关词的组合规则,但由于规则的提取很深地依赖于语言知识,而且很难穷举出所有的特征规则,因此会影响分类的效果.支持向量机(SVM)是建立在统计理论基础上的机器学习方法,对于小样本分类问题有很好的识别效果.文中分析和定义了汉语问句的类型,建立了以SVM为基础的问句分类模型,详细描述了问句分类特征的选取过程,并在句法特征的基础上引入语义特征进行汉语问句分类实验,分类准确率达88.7%,表明结合句法和语义特征以SVM进行汉语问句分类具有很好的效果.  相似文献   

12.
在特定领域问答系统中,领域知识直接影响问答效果.本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候选段落.对于定义性问题,结合关键词加权权重计算方法及句子与问题语义相似度方法,对候选段落或句子与问题相关度排序,提取相关度高的句子或段落作为答案,对于数词或列表性实体问题,借助命名实体识别,提取与问题中心相关的领域实体作为答案.在云南旅游领域进行了答案提取实验,结果表明该方法具有较好的效果.  相似文献   

13.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

14.
试题是试题库的基本构成单位,要保证试题库中有较大的试题总量必须允许同一内容出具多题型多数量的试题。为了解决在试卷中不出现相同内容的试题需要在管理系统程序加以控制,本文介绍了在题号中设计知识点号和内容号利用题号各组成部分的含义在抽取试题的过程中分层次计算并排除相同题号记题的方法。  相似文献   

15.
针对中文问句分类缺乏丰富的句法语义特征,提出一种基于词袋绑定的问句新特征自动生成方法.在词袋(BOW)、词性(POS)和词义(WS)等基本特征的基础上,通过将词性、词义等与词袋分别进行绑定,自动获取一类新的问句特征即词袋绑定特征.采用SVM分类器在哈工大中文问句集上实验,结果表明与原来单个的POS、WS等基本特征相比,对应的W/POS、W/WS等词袋绑定特征在分类精度上均获得了显著的提升;而且对这些词袋绑定特征进行启发式组合以后,在77个小类问题类别的总体分类精度达到82.333%,取得了较好的分类效果.说明在基本特征基础上借助词袋绑定操作进一步构造问句新特征的方法简单而有效.  相似文献   

16.
银行领域汉语自动问答系统BAQS的研究与实现   总被引:13,自引:2,他引:13  
介绍BAQS的研究背景和系统框架.探讨基于问点块和语义块识别以及句模匹配分析问句的新方法,并用向量表示整个问句语义.借鉴本体和知网思想,构建银行领域本体库和银行知网.采用预先对金融领域实用文本进行标注,依据问句向量从标注树中提取答案.并针对某银行实现汉语自动问答系统.实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值.  相似文献   

17.
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法.首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留...  相似文献   

18.
提出了一种基于特征融合的问句匹配框架来解决问句相似度检测方法,利用答案特征、词序特征、统计特征和语义特征相结合来解决问句相似度计算问题.在Yahoo!Answers上抽取的真实标注数据集上进行实验,实验结果表明:该方法在性能上得到了较好的结果.  相似文献   

19.
面向财税领域非事实型问题, 提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注, 引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选, 并从相似案例中抽取相应答案。在真实数据集上的测试结果表明, 该方法在准确率和效率上比基准方法有显著提升。  相似文献   

20.
基于ontology的智能答疑系统的研究   总被引:1,自引:1,他引:0  
在受限领域自动问答系统中,用户问句的语义理解是提高查询效率的关键。提出了一种基于本体的自动问答系统模型,对领域知识本体的构建进行了研究。利用本体中丰富的语义关系,对用户的问题查询请求进行语义扩展,提高问答系统的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号