首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
分析了目前搜索引擎研究的现状,利用语义Web和本体论的相关技术,实现了一个基于本体论的智能搜索引擎模型。主要研究了本体论的建立,网页本体标注,用户查询本体表达以及本体匹配等几个方面。通过对模型的原型设计运行和分析,结果表明通过本体论技术的支持该模型可以较好的理解采集到网页信息以及用户查询请求,从而提高了搜索引擎的自动化和智能化程度。  相似文献   

2.
当前基于本体的语义标注工具的分析   总被引:4,自引:0,他引:4  
基于本体的语义标注工具使用已有本体在Web页面中插入语义元数据信息,从而使Web页的内容机器可识别,它完成的是构建语义Web的基础性工作.本文将对当前基于本体的语义标注工具进行分析和比较,并总结和探讨基于本体的语义标注工具的发展趋势.  相似文献   

3.
基于本体的语义标注工具使用已有本体在Web页面中插入语义元数据信息,从而使Web页的内容机器可识别,是将现有Web提升为语义Web的有效方法之一.大多数标注工具仅支持使用已存在的本体词汇来标注Web页,不具备标注过程中新建本体或在已有本体中添加新词汇从而补充标注词汇的本体编辑功能.针对语义标注中的本体编辑功能的特点及存在问题进行研究,并从实现的角度对OWL本体编辑进行讨论.  相似文献   

4.
Web2.0为信息检索提供了很多可以使用的资源,其中两种资源对于个性化检索而言非常有益,那就是社会化标注和网页分类信息。用户给出的标签反映了其对于网页的认识和思考,而用户标注过的网页的类别则反映了用户在选择时的偏好和兴趣,两者的结合使用对个性化检索能起到良好的效果。在仅使用社会化标注进行个性化检索的方法上,提出基于标注和网页分类进行个性化检索的方法,通过两者结合筛选出兴趣和偏好相近的用户,进行用户属性的扩展,并在扩展时考虑用户的质量,从而能在个性化检索中取得更好的结果。在真实数据集上的实验表明,本文方法具有一定的优势。  相似文献   

5.
为了减轻用户在检索信息过程中的负担,根据现有信息检索模型存在的问题,引入本体的概念,建立了一种基于本体的信息检索模型.该模型目标是根据浏览器的历史记录、用户浏览网页的浏览行为等,来更新用户兴趣模块,以不同用户的不同信息需求向用户推荐符合用户意图的信息,从而有效的提高信息检索的查全率和查准率.  相似文献   

6.
在分析查找互联网股票信息存在问题的基础上,给出了一个基于语义Web的股票信息表示模型.首先利用语义Web定义股票本体,给出了相应的RDF模式描述,对本体进行评估.其次,通过分析用户股票信息需求,利用构建的股票本体,给出基于语义Web的模型的体系结构,建立了一个能根据用户请求提供所需要的股票信息的股票信息表示模型;最后通过实例验证了该模型的有效性.  相似文献   

7.
引入QoS本体,提出了一种基于QoS本体的语义Web服务选择算法.该算法通过构造Web服务的QoS本体模型以支持异构QoS参数的语义描述和度量,并将QoS语义匹配和数值匹配相结合,从而更准确地为用户选择满足其个性化需求的Web服务.仿真实验表明,基于QoS本体的语义Web服务选择算法能够充分利用QoS语义和数值信息,为用户选择更合适的服务,实现用户对Web服务的个性化需求.  相似文献   

8.
Web信息抽取与语义检索框架   总被引:1,自引:1,他引:0  
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统.  相似文献   

9.
基于本体的数字图书馆信息过滤研究   总被引:4,自引:0,他引:4  
语义Web的概念正在成为计算机信息处理领域当前研究的热点之一 .本体 (Ontology)将在“语义Web”中起到至关重要的作用 ,它通过提供共享的并精确定义的术语源 ,将语法的互操作扩展到语义的互操作 .信息过滤目的在于依据用户兴趣 ,进行动态信息搜索和匹配以满足用户的需求 ,从而实现个性化服务 .本文提出了一种新的基于本体的数字图书馆信息过滤方法 ,它具有 3个显著的优点 :①采用了混合信息过滤模型 ,克服了基于内容和协作过滤的不足 ;②建立本体驱动的用户模板 ,解决了用户兴趣的获取问题 ;③信息内容采用本体来组织 ,实现语义级查询和高效的匹配机制  相似文献   

10.
提出了一种面向网络信息的层次过滤模型及其体系架构,该模型分为本体过滤层、需求过滤层和兴趣过滤层.本体过滤层中,利用本体为基础对信息内容进行语义描述,实现信息的计算机理解与过滤;在需求过滤层,模型通过理解用户所提出的需求中所包含的语义,进而更加准确地通过过滤规则进行信息流过滤;在兴趣过滤层,用户兴趣通过特定方式表达,并通过语义相似度计算实现第三过滤层.  相似文献   

11.
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。  相似文献   

12.
SVM-KNN分类器在网页分类中的应用   总被引:1,自引:1,他引:0  
为了提高中文网页自动分类的分类精度,将SVM-KNN方法用于中文网页分类.提出了一种中文网页的表示方法,在将下载的网页全部表示为向量空间的向量后,用SVM构造了一个多类分类器.在分类时通过在特征空间计算网页所表示的向量和分界面的距离决定采用SVM方法还是KNN方法对其分类.实验证明该方法是一种有效的方法,对网页分类的各类,使用该方法均比使用SVM方法具有更高的分类精度,同时能缓解SVM训练时对核参数的选择困难问题.  相似文献   

13.
针对传统通用网络信息采集系统自身固有的缺陷,根据语义分析的相关理论,本文提出了基于语义的网络爬虫的相关模型,该模型构建知识概念集合,并对其进行关键字切割与划分,生成能表达主题的主题关键词集合。结合中国《知网》的相关理论与技术,对传统抓取的网页在语义的角度进行分析,对已抓取的网页页面内容及其中链接的扩展元数据等相关信息进行分词及语法语义等相关处理,获取网页内容关键词集合及超链接的关键词集合,然后分别对获取的网页内容关键词与链接关键词进行与主体关键词集合采用语义分析算法进行语义相关性的判定,保存需要的网页,并预测及提取与主题相关的URL,从而提高网络资源信息采集相关率。  相似文献   

14.
Nutch的网页更新预测方法采用的是邻比法,相关更新参数需要人为设定,不能自适应调整,无法应对海量网页更新的差异性.为解决这个问题,提出动态选择策略对Nutch的网页更新预测方法进行改进.该策略在网页更新历史数据不足时,通过基于MapReduce的DBSCAN聚类算法来减少爬虫系统抓取网页数量,将样本网页的更新周期作为所属类其他网页的更新周期;在网页更新历史数据较多时,通过对网页更新历史数据进行泊松过程建模,较准确地预测每个网页的更新周期.最后在Hadoop分布式平台下对改进该策略测试.实验结果表明,优化后的网页更新预测方法表现更优.  相似文献   

15.
通常搜索引擎网站都有存储大量远程站点复制网页的数据库.为保持复制网页和源网页的同步,需要花费大量的时间和资源.本文提出了保持复制网页和源网页一致的多种同步新策略,并提出源端网页变化的泊松模型,给出了刷新率和刷新时长的规范性描述,对各种同步策略的性能进行了研究和比较分析,发现其较大地改善了网页数据库刷新率.  相似文献   

16.
针对现有时间本体缺少基本本体理论依据的缺陷,在分析了时间本体中的概念的公理后,提出了基于"角色"和"关系"构建时间本体的思想,明确区分出了角色概念,解决了潜在的语义混乱的问题.并用本体构建工具Hozo实现了时间本体,为语义网中网页的时间内容和网络服务的时间属性的表示提供了依据.  相似文献   

17.
提出一种新的基于用户访问路径分析的页面推荐模型.该模型采用在线处理方式,利用增量图划分方法形成页面聚类,依此生成动态页面推荐.模型以Apache模型的形式实现,可适用于大型商业网站以及内容更新频繁的网站.试验结果表明,该模型具有较好的整体性能.  相似文献   

18.
自适应Web站点站能够根据用户需要快速灵活地改变自身,动态适应不断变化的用户需求和应用环境.通过Web日志文件的挖掘,找出用户的访问模式,及该模式中的访问类型,而且分析当前访问页面的频繁度后,形成经过内容裁剪的个性化页面来压缩Web页面内容.在此基础上,设计了一个自适应站点模型,改善Web站点的结构和组织形式以使站点达到更好的效果.  相似文献   

19.
提出一种基于向量空间模型的多层网页分类方法.该方法用主题词、修正主题词和主题概念从3个层次构建网页表示向量,从而在概念层次上更贴近网页的语义,且向量维数低于传统的特征向量.实验结果表明,该方法降低了分类时的计算量,提高了网页分类速度和分类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号