首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 468 毫秒
1.
在面向领域的信息搜索中,本体作为相关的领域知识往往有助于改善搜索效果,在信息检索中被广泛应用.基于本体增量学习的主题爬行技术的研究工作主要包括:首先,利用本体对领域概念及关系的描述作为网页主题判定的依据;其次,在爬行过程中,将学习得到的新概念和关系加入到本体中,以丰富完善领域本体,进而提高主题爬虫的收获率;最后,经过大量的实验数据分析,在词条提取准确率、收获率和响应速度等多个指标方面,证明了所提出的方法是可行的并且是高效的.  相似文献   

2.
分析了最好优先搜索策略中遇到的隧道问题,设计并实现了一种基于本体的主题爬虫系统。  相似文献   

3.
随着互联网的信息以指数级增长,用户希望搜索引擎能够提供面向专业的更准确智能搜索服务,主题搜索引擎的研究显得越来越有意义。本文对基于本体语义主题搜索引擎系统的关键技术进行研究。首先建立主题搜索引擎系统流程,对主题网络爬虫,网页主题相关度、网页主题分类进行了算法研究。最后以服装纺织领域的主题搜索实现为例,说明主题搜索引擎系统能更准确快速实现专业搜索服务。  相似文献   

4.
语义网自适应学习系统中领域本体的构建   总被引:2,自引:0,他引:2  
为了学习者适应学习系统,创建相关学科的领域本体,发挥语义网的作用.根据学生的个性特征和学习进程动态地呈现教学内容,更好地满足学习者的需要,提出了基于语义网构建的自适应学习系统,为人们的学习提供了非常有效的支持.在描述自适应学习系统、语义例和本体相关知识的基础上,以一门课程为例进行了领域本体创建的实践,为自适应学习的实现奠定了基础.  相似文献   

5.
基于本体语义的定题爬虫   总被引:3,自引:0,他引:3  
定题爬虫能迅速获取网络上特定主题的大量信息,对专业搜索引擎及数据挖掘应用都具有重大价值.针对目前通用的基于关键词主题过滤策略的不足,在概念聚集思想启发下,提出了基于本体语义的主题过滤策略.同时根据网页具有不同位置不同信息重要性的特点,提出了改进的加权特征项权值计算公式,实现基于语义的网页实时过滤.为进一步提高爬虫的工作效率提出链接相关度预测算法.对比实验表明此策略具有可行性.  相似文献   

6.
从全局上限定采集范围可以有效地提高主题爬虫的查准率.结合Web链接分析和页面内容特征分析,提出了一种基于复杂网络局部社区发现的主题爬行方法,将主题爬行分为两个阶段,第一阶段采用复杂网络的局部社区发现算法进行Web链接分析,构建主题网站群,缩小爬行范围.在第二阶段,在限定的范围内,对爬取到的页面进行主题相似度判定,并对下一步的链接目标进行预测.实验证明,该方法显著提高了主题爬虫的查准率.  相似文献   

7.
针对传统搜索方式和查询界面的不足,提出了基于Deep Web 的地图搜索系统框架,前台采用活动地图与用户进行交互,后台采用领域本体和Deep Web 爬虫进行识别和相关信息的收集。此系统应用于与地理位置相关的主题信息类网站,使用户能够直观便捷地搜索到所需的信息,提出了一种信息搜索的新思路。  相似文献   

8.
将本体思想引入计算机支持的协同学习系统,可以根据学生的个性特征和学习进程动态地呈现教学内容,更好地满足学习者的需要。在描述个性化协同学习环境和本体相关知识的基础上,构建了计算机学科领域本体核心分层结构,并以数据结构课程为例建立了课程本体模型,为个性化协同学习系统的实现奠定了基础。  相似文献   

9.
针对现有的主题爬行方法存在收益率不高和不稳定的问题,融合本体和最小二乘支持向量机理论,提出一种主题爬行方法 Ontology-LSSVM.该方法将本体作为抓取主题的背景知识表示,得到一组主题相关概念的集合,再将其在网页文本中出现的词频作为输入,构造一个主题相关度LS-SVM分类器,用于网页的分类.使用舆论热点的食品安全问题作为爬行主题领域,建立问题食品本体,进行实验.结果表明:在本实验条件下,本文方法相比基于LS-SVM、基于本体和基于关键字的主题爬行,能够维持更高的收益率.  相似文献   

10.
提出建立本体的协作-挖掘方法,即领域专家、知识工程师、领域终端用户通过互联网,协作建立本体.利用网络爬虫从语义网搜索并收集RDF文档或片段,自动分析初步建立RDFDB.自动分析领域专家、领域终端用户使用半形式化语言RDFL书写的实例文档和它们使用引导程序输入的记录,完善RDFDB.检验清洗RDFDB数据,并设计本体挖掘算法挖掘产生初始领域本体.挖掘算法使用红黑树建立索引,最坏时间复杂度为O(n 3log 2n).验证、评估初始本体产生领域本体,并产生文档说明.建立新本体时,可合并RDFDB集成现有本体.在实验系统中,应用该方法建立计算机硬件信息领域本体.实验结果表明该方法是可行和高效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号