首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
WWW网站分类体系包装器WCSW   总被引:1,自引:0,他引:1  
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.  相似文献   

2.
基于分类本体的Web信息集成机制,构建了一个Web信息集成系统的体系结构.根据网站组织结构,抽取网站分类体系,使用该体系进行了基于结构的页面信息分类.在网站分类本体的支持下,集成各信息源网站的分类体系,合并对应类别下的信息,得到集成分类体系下的集成视图,最终以基于portal的集成视图形式展示集成结果,为终端用户提供更为方便的服务和应用.  相似文献   

3.
网页分块方法使得Web信息抽取的单位由原来的页面缩小为分块.结合分块重要度模型与二维条件随机场的优点,提出一种Web对象信息抽取方法.该方法利用分块重要度模型对网页分块进行重要度标注,过滤掉大量与主题无关信息,更加准确的定位待抽取信息的位置.二维条件随机场模型相比传统的线性条件随机场模型更好的适应了网页分块的二维结构,有效的提高信息抽取准确率.实验结果表明,该方法对Web对象信息抽取具有良好的效果.  相似文献   

4.
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。  相似文献   

5.
张柱和 《科技信息》2009,(19):51-52
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面太广,而用户需要的却只是其中很少的一部分。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的、有用模式和隐藏的信息。本文主要研究了Web数据挖掘的内容,包括Web挖掘的特点、Web挖掘的分类和Web挖掘流程等。  相似文献   

6.
基于分块的网页主题文本抽取   总被引:2,自引:2,他引:0  
根据网页文本信息的结构和内容特征,提出一种网页主题文本信息的抽取策略,将网页文档表示为DOM标签树的形式,然后根据Web页面的结构特征进行内容块的分割,以网页的文本内容特征为依据识别链接型和主题型内容块,并提取主题型网页的文本信息块.实验结果表明:基于分块的方法有效地实现了链接型和主题型网页的分类,并准确地完成主题型网页的文本信息块的抽取任务,是一种简单、准确的网页信息抽取方法.  相似文献   

7.
将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中,实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个性化布局的功能,显著提高了网站管理中处理大量信息的效率,增强了网站的个性化特征.  相似文献   

8.
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取.  相似文献   

9.
李洋  栾吉华 《科技资讯》2007,(35):80-81
以往基于DOM的Web信息抽取方法在信息抽取过程中存在如需要较多样本集、适应性较差等问题,为解决Web上的信息在抽取中存在的问题,本文提出了一种在原有基于DOM的Web信息抽取方法的基础上引入竞争分类方法进行信息抽取.  相似文献   

10.
Deep Web查询接口分类是实现Deep Web在线数据库分类访问的主要方法,本文在研究查询接口特征数据抽取和表示的基础上,通过对查询接口所在Web页的位置来构建对应的接口特征XML文档,根据XML文档中的节点位置不同,分别为不同的查询接口特征赋予不同的分类权重因子,以提高有效特征的分类能力,并采用信息增益算法实现最终分类特征的选择,然后采用KNN分类算法实现查询接口分类,实验结果表明此方法的实际可行性.  相似文献   

11.
介绍了网站分类法的基本概况,以雅虎(YAHOO)、搜虎(SOHU)为例详述了综合性网站和搜索引擎的分类法,又以图书馆学科导航网站为例分析了网络信息学科导航或门户网站的分类法,归纳了网站分类法的特点。  相似文献   

12.
通过对我国水利网站进行的研究,对目前处于零散分布状态的国内水利网络按网站本身的性质属性和信息源机构属性进行了分类比较,并在分类基础上对典型站点及其栏目做出了评价和推荐。  相似文献   

13.
从总体情况、网站内容建设、网站导航、信息服务等方面对我国CALIS高校机构库联盟中的10个高校机构库网站进行了调查分析,认为我国高校机构库网站存在数量较少、版本单一、机构简介不完善、外部导航欠缺、咨询服务平庸等问题,并针对这些问题提出了相应的建议。  相似文献   

14.
为辅助游客通过旅游网站进行酒店选择,提出了一种基于旅游网站提供的备选酒店特征信息和在线评价信息的酒店选择方法.首先,基于酒店特征信息和在线评价信息构建备选酒店有向加权图,依据备选酒店特征信息,基于离差最大化法对酒店特征进行客观赋权,并采用简单加权法确定有向加权图结点权重,依据备选酒店间在线评价信息的比较关系确定有向加权图的有向边及有向边权重;然后,基于PageRank算法原理给出备选酒店排序值求解算法;最后,以基于缤客网站提供的酒店特征信息和在线评价信息进行酒店选择.结果说明了提出方法的有效性和可行性.  相似文献   

15.
针对路由冲突下语义特征信息进行查准,一直存在查准率低的问题。提出一种新的语义特征信息查准算法,首先构建路由冲突下语义网的本体模型,提高语义网中数据的特征分类挖掘和检索能力;接着采用概念树三叉分割思想,实现路由冲突下的语义特征信息的分析;最后通过灰色关联度信息综合评价方法解决语义多属性决策问题,提高了路由冲突下语义特征信息查询的查准率。实验仿真结果证明,采用改进的查准算法在路由冲突下进行语义信息检索其查准率较高,语义特征提取结果准确,提高了语义搜索的准确度,应用价值较高。  相似文献   

16.
张强 《实验室科学》2013,16(4):86-89
随着网络技术的高速发展,网站安全问题成为高校校园网站的安全威胁隐患。高校网站已从一个简单的信息发布、展示平台,逐步转变为汇集了招生就业、培训、科研成果共享、等功能的重要载体。高校网站已积聚了教育信息化建设中大量的信息资源,成为高校成熟的业务展示和应用平台。然而近年来,高校网站所面临的Web安全形势越来越严峻,安全威胁突出地表现出来,极大地困扰着高校网站的管理者,对信息网络和核心业务造成严重的破坏。Web应用的安全已成为互联网时代棘手需要解决的重要问题之一。高校网站的遭受的安全攻击事件有其特点性,主要的安全问题集中在以下方面:网站被黑;数据和内容篡改;被挂马、植入黑链。针对当前高校校园网站的特点及安全问题进行分析与思考,提出适用于高校的可靠、高效的安全防护策略来保障高校网站安全。  相似文献   

17.
为提升变电站巡检机器人的导航避障能力,将深度学习技术应用于变电站场景识别中,提出了一种基于深度卷积神经网络的避障方法.该方法联合图像分类和语义分割两个分支来共同辅助机器人导航避障,分类分支通过获取图像全局信息,保证机器人正确行驶方向;而语义分割支路则根据图像局部信息以及机器人前方目标类别,指导机器人准确避障.实验结果表明,避障方法可以高效地对图像进行分类和分割,同时,在实际变电站环境中,该方法也能为巡检机器人提供有效的避障信息,实现实时自主避障.  相似文献   

18.
基于PageRank算法的商业网站推广策略研究   总被引:1,自引:1,他引:0  
搜索引擎已经成为当前检索信息的重要工具.为了提高网站在搜索引擎中的排名,必须对网站进行优化。文章针对目前流行的Google搜索引擎,集中研究了网站结构对基于PageRank算法的网站搜索引擎排名产生的影响,并分析该算法在独立网站下的效果,提出了相应的优化策略,总结了PageRank算法存在的不足,这对促进网络信息获取技术向高精度、智能化方向发展提供了很大的参考价值。  相似文献   

19.
基于语义上下文分析的因特网人物信息挖掘   总被引:1,自引:0,他引:1  
网络信息的爆炸式增长给人物信息的自动获取带来了巨大挑战.论文针对因特网上大量的人物信息,设计了一种基于语义上下文分析的人物信息挖掘体系框架,重点阐述了人物简历信息识别方法、基于隐马尔可夫模型(HMM,H idden M arkovModel)的命名实体识别方法和基于语义上下文分析的人物信息抽取算法.经实验表明:基于语义上下文分析的人物信息挖掘方法具有较高的信息抽取效率和精度.  相似文献   

20.
教学网站评估方法研究及其应用   总被引:9,自引:0,他引:9  
为解决教学网站质量评估分级问题,在参考了国内外网站评估标准的基础上,时于教学网站三个层面,运用多目标决策理论与灰色关联分析法进行评分,建立起一套多专家群体决策的网站分级评估系统.并以电子商务教学网站为具体案例详细说明网站评估流程,研究结果表明该评估系统方法有助于国内高校教育信息网络资源的建设和发展.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号