首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
首先, 在句子组织信息之间的结合度及基于规则、 词性和词序对句法分析系统影响的基础上, 提出一种基于规则的语句分析识别算法, 能在大量文本中快速识别出正确句式; 其次,在基于语句分析识别算法的基础上, 提出一种基于规则与句法合成的层次化语句分析识别算法, 以提高层次化句式识别检错的精度. 实验结果表明, 该算法平均精确率和平均召回率分别为84.65%和77.15%, 相比于只基于规则的语句识别算法分别提高了11.79%和14.48%, 证明了规则与句法合成的层次化语句分析识别的可行性.  相似文献   

2.
首先, 在句子组织信息之间的结合度及基于规则、 词性和词序对句法分析系统影响的基础上, 提出一种基于规则的语句分析识别算法, 能在大量文本中快速识别出正确句式; 其次,在基于语句分析识别算法的基础上, 提出一种基于规则与句法合成的层次化语句分析识别算法, 以提高层次化句式识别检错的精度. 实验结果表明, 该算法平均精确率和平均召回率分别为84.65%和77.15%, 相比于只基于规则的语句识别算法分别提高了11.79%和14.48%, 证明了规则与句法合成的层次化语句分析识别的可行性.  相似文献   

3.
将本体与和Web信息抽取技术相结合,将信息抽取的重点放在特定的领域,利用表格属性定位、识别表格结构生成启发式规则,可以大大提高信息抽取的准确率。  相似文献   

4.
为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题, 提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合, 计算候选概念在领域术语关系中的深度和广度, 利用深度和广度信息反馈概念隶属度的思想, 定量分析术语与领域的隶属程度, 进行本体概念的领域隶属度检查, 完成领域本体概念的提取。实验结果表明, 该方法提高了领域本体概念的提取效率和准确率, 具有可行性和合理性, 领域本体概念的提取准确率提高了12%左右。  相似文献   

5.
针对搜索引擎查找准确率低、检索效果差的问题,提出了基于本体的搜索引擎.该搜索引擎首先构建相关主题本体知识库,再利用网络爬虫下载网页内容和网页结构特征,并对内容进行智能识别,找出与本体相关内容识别为相关本体,通过与本体知识库内容对比,筛选特定的统一资源定位器(URL)地址及与计算机网络安全相关的本体,从而发现计算机网络安全相关信息,同时建立不同服务提供者之间的关联关系及服务提供者之间的层级关系,最后将抽取出的计算机网络安全信息存储到以本体为模型创建的数据库中,并成为用户搜索服务的最终数据来源.实验结果表明,本体可提高搜索引擎的查准率,减少冗余信息,从而提高查询精度.  相似文献   

6.
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。  相似文献   

7.
基于语义的旅游信息搜索引擎   总被引:2,自引:1,他引:1  
在分析传统检索技术存在的问题基础上,采用Ontology技术结合传统搜索技术构建了一个基于语义的旅游信息搜索引擎,提出新的本体构建方法,给出了构建旅游信息领域本体的过程.根据用户的搜索需求定制规则,使用Jena的推理机制,通过规则对旅游信息本体进行语义访问与逻辑推理,提供更为灵活、有效的检索方案,向用户提供智能化、知识化服务,提高了搜索引擎的查准率和查全率.  相似文献   

8.
针对数据质量中约束规则描述的语义复杂性、 快速提取等问题, 引入本体技术描述数据质量约束规则等 要素的语义关系, 提出了元本体的思想, 对数据质量领域的核心词汇进行了提练, 并依据相关标准, 构建了与 领域无关的数据质量元本体模型。 在应用中, 特定领域可根据需求将该元本体模型实例化为用于描述本领域 的数据质量本体, 不仅解决了数据质量领域词汇共享与明确描述问题, 而且使数据质量复杂约束规则语义描述 得以解决。 同时, 以石油领域数据为例, 依据提出的质量本体元模型实例化出石油领域的质量本体模型, 定义 了各种推理规则, 并基于 Jena 推理机验证了构建的数据质量本体的合理性, 极大地提高了数据质量评估中约 束规则提取的效率。  相似文献   

9.
Web技术的发展导致Web数据激增,其中Deep Web数据占主要部分.实体识别是开展模式识别、数据集成等Deep Web关键技术研究的首要前提.为提高实体识别的效率和准确性,提出了基于模板的Deep Web实体识别信息抽取方法.该方法拥有三个不同的处理阶段:其中基于DOM树抽取规则的模板训练阶段最为关键,抽取规则通过结构分析和语义分析两个阶段完成,此外该方法还包含着数据准备和实体信息抽取两个辅助阶段.最后经实验验证所提方法在提升实体识别准确性的同时具有较好的信息抽取效率.  相似文献   

10.
为了提升身体动作的识别效率,减少身体动作中整体位移对识别效果的影响,提出了一种基于规则的动作快速识别方法.首先,建立简化的关节点模型,并以髋关节中心点建立投影坐标系;其次,定义身体关节夹角和中心参数,设计动作判别函数,基于实验数据建立判别规则库与动作分类库;最后,将实时采集的关键帧数据与规则进行匹配,实现动作的快速识别...  相似文献   

11.
本体应用综述   总被引:1,自引:0,他引:1       下载免费PDF全文
从本体应用基础、本体应用的相似度计算方法、本体应用领域及存在问题3个角度对本体的应用进行综述,指出本体将在智能化识别推理、产品设计和材料搭配、信息和知识管理、云计算和物联网等5个方面得到更广泛、更深层次的应用。  相似文献   

12.
构造领域本体所需的信息源选取方法的研究对解决本体的构造质量、构造效率等问题,以及推广与发展领域本体有着重要意义.传统的信息源文档选取方法只考虑概念因素,不能很好地解决该问题.因此,首先利用抽象方法分析了领域本体所需信息源具有的概念性、关系性和预测性等特点.然后,针对这些特点分别采用改进的VSM方法、基于本体关系距离的方法以及神经网络方法计算文档权值.最后,通过编写的软件OnMaker产生模拟数据得到概念、关系和预测3个权值,从而计算出每个文档权值,并使用与"湿地保护"相关的真实文档验证该模型,达到了较好排序选取的效果.  相似文献   

13.
基于关系数据库的大规模本体的存储模式研究   总被引:14,自引:1,他引:14  
通过对现有本体存储模式的分析,给出了本体存储模式的设计原则,并基于该原则提出了一种新的本体存储模式.该模式针对本体描述语言的特点,将本体查询常用的信息存放在不同的表中.整个模式易于理解,结构稳定,并且减少了本体查询时进行表连接的代价,提高了查询效率.实验结果表明,该存储模式不仅具有较高的查询效率,而且具有良好的可扩展性,适用于存储大规模的本体.  相似文献   

14.
针对本体映射时未充分考虑语义信息以及运算效率的问题, 提出了一种改进的多策略本体映射方法--ReMAP。对初步得到的初始概念集基于相关度计算进行简化, 以减少参与映射的概念; 为提高映射质量, 在进行概念相似度计算时, 充分考虑本体概念的语义信息, 对概念名称进行语义分析, 将其融入概念名称相似度的计算结果, 并通过制定映射规则对不良映射进行校正处理。算法验证选取OAEI2007 标准测试集, 通过查全率、查准率与F-measure 值对实验结果进行对比分析, 验证了方法的有效性。  相似文献   

15.
本体相似度计算是信息检索的重要研究课题并广泛应用于计算机科学的诸多领域.运用变换模型提出本体相似度计算和本体映射的新算法.通过排序学习函数,将本体图映射成实直线,将本体图中的顶点映射成对应实数.通过比较本体图中顶点所对应实数的差值来判断两个顶点的相似程度.两个实验显示,所提出的算法对计算本体相似度和建立本体映射是有效的.  相似文献   

16.
为了加强面向领域的搜索技术查询有效性与准确性,在证券领域本体的基础上对检索表达式进行扩展,使检索内容更加相关.对于初始检索集,根据本体进行面向语义排序,提高了检索结果集相关度.对面向证券领域的语义信息检索系统框架数据流与算法效率进行了分析,并对语义排序算法功能进行增强,得到自适应热点算法扩展,使系统可以在特定时间段内根据用户点击率反映阶段性关注热点.  相似文献   

17.
李世扬  储泽楠 《科技信息》2009,(31):J0051-J0052
传统的信息搜索模型缺乏语义理解。而本体是对共享概念模型的明确的形式化规范说明,提供基于语义的知识表示和共享。本文通过引入个人知识本体,综合利用智能Agent的主动性、协作性、移动性等特性,采用协同式过滤的基本原理,提出了基于Agent与个人知识本体的个人搜索系统,有效地提高了检索效率。文中提出了通过不断的学习用户的反馈信息,对个人知识本体中的概念进行修正的算法,并探讨了多Agent协同信息过滤技术在搜索系统中的应用。  相似文献   

18.
Web信息抽取与语义检索框架   总被引:1,自引:1,他引:0  
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统.  相似文献   

19.
提出了一种面向网络信息的层次过滤模型及其体系架构,该模型分为本体过滤层、需求过滤层和兴趣过滤层.本体过滤层中,利用本体为基础对信息内容进行语义描述,实现信息的计算机理解与过滤;在需求过滤层,模型通过理解用户所提出的需求中所包含的语义,进而更加准确地通过过滤规则进行信息流过滤;在兴趣过滤层,用户兴趣通过特定方式表达,并通过语义相似度计算实现第三过滤层.  相似文献   

20.
提出一种基于最大熵模型的中文疾病命名短语识别方法,在模型特征选择上,将领域本体信息作为模型的一种特征.由此实现的疾病命名短语识别分类器具备有监督学习和利用领域知识的能力.实验结果表明,对于疾病命名短语识别的准确率达到89.7%,召回率87.6%,F-评价值88.64%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号