首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 93 毫秒

1.  Web信息采集中页面分块技术的研究  
   徐薇《武汉科技学院学报》,2007年第20卷第5期
   本文提出了一个基于网页分块的信息采集系统模型。在页面分析阶段,引入了改进的基于视觉的页面分块方法,这是一种自顶向下的、标签树独立的方法,其目的是检测出Web内容结构,实验结果令人满意。基于分块后的页面,利用一个经验交互式的噪音去除算法Page_CN,定义页面的噪音区间,去除噪音区域,得到更加明确的主题区域。    

2.  网页设计布局方法的探讨  
   《云南大学学报(自然科学版)》,2013年第35卷第Z1期
    在设计网页之前,要对网页进行合理布局,所谓“网页布局”,就是给将要出现在网页中的所有元素进行定位.网页布局是网页精彩与否的重要因素之一.网页布局关系着内容的编排和页面的排版,它直接影响着网页信息的浏览及体现出网页的美感.介绍了几种不同的网页布局方法,并用实例说明了DIV+CSS实现网页布局的方法.    

3.  网页分类中的数据预处理方法研究  
   郭淼霞《莆田高等专科学校学报》,2011年第5期
   讨论了网页分类过程中数据预处理的相关技术,提出一种网页预处理方法,将网页解析为DOM树结构,通过分析、整理,得到噪音信息的特征,并依据判定规则,找出噪音信息并删除处理。网页去噪后,提取页面中的文本信息和每个相关链接目标URL、源URL及锚文本并存入数据库。实验结果证明,该去噪方法可以有效去除网页噪音,利用所提取的超链接结构信息分类网页,可以有效提高分类精度。    

4.  一种基于噪音清除的网页削重算法  
   吕争  陈侃《信阳师范学院学报(自然科学版)》,2007年第20卷第1期
   提出了一种基于噪音清除的网页削重算法.首先应用空间向量模型,仅仅使用<特征词,权重>二元组表示网页,降低削重算法的时空复杂度;其次,通过一组启发式规则来消除网页中包含的“噪音”,消除了无关信息对网页核心内容的干扰.    

5.  一种基于块分析的网页去噪音方法  被引次数:3
   刘晨曦  吴扬扬《广西师范大学学报(自然科学版)》,2007年第25卷第2期
   一张网页通常由许多信息块组成,除了主题内容块以外,还常常包含广告信息、导航条、版权信息等信息块。结合网页块大小、位置等信息以及网页本身的一些特点,提出了一种基于块分析的、自动调整阈值的去除噪音方法,该算法显著减少了网页的噪音,并通过网页分类对比实验证明了该算法的有效性。    

6.  基于标签密度的自适应正文提取方法  
   孙皓  董守斌《郑州大学学报(理学版)》,2009年第41卷第1期
   提出一种新颖的网页去噪方法,利用标签和锚文本在网页中不同部分的分布差异来判断是否为正文信息,同时根据正文部分的不同区域标签的分布波动,算法自我学习并调整相关阈值,可有效去除网页噪音.该方法简单易行,网页正文信息提取及网页分类的实验均表明了该方法是有效的.    

7.  基于网页分块的Shark-Search算法  被引次数:1
   陈军  陈竹敏《山东大学学报(理学版)》,2007年第42卷第9期
   Shark-Search算法是一个经典的主题爬取算法. 针对该算法在爬取噪音链接较多的Web页面时性能并不理想的问题, 提出了基于网页分块的Shark-Search算法, 该算法从页面、块、链接的多种粒度来更加有效的进行链接的选择与过滤. 实验证明, 改进的Shark-Search算法比传统的Shark-Search算法在查准率和信息量总和上有了质的提高.    

8.  基于SVM的金融类钓鱼网页检测方法  
   张峰  胡向东  林家富  郭智慧  付俊  刘可《重庆邮电大学学报(自然科学版)》,2017年第29卷第6期
   针对金融服务领域面临的严峻信息安全挑战,以及现有钓鱼网页检测方法的不足,提出一种基于支持向量机(support vector machine,SVM)的金融类钓鱼网页检测方法.采用网页渲染去除常见的页面特征伪装,提取统一资源定位符(uniform resource locator,URL)信息特征、页面文本特征、页面表单特征以及页面logo图像特征,构建特征向量训练SVM分类器模型,实现对金融类钓鱼网页的识别.在特征提取过程中,利用适合中文的多模式匹配算法AC_SC(AC suitable for chinese)提高文本匹配效率,并采用加速鲁棒特征(speeded-up robust feature,SURF)算法实现logo图像的特征提取与匹配.多方法实验结果对比表明,该方法针对性更强,能达到99.1%的检测准确率、低于0.86%的误报率.    

9.  网页布局优化设计方法探析  被引次数:1
   吴胡和  周非凡《科技资讯》,2011年第18期
   随着网络应用的日益广泛,网页作为传播信息载体,其布局直接影响着网页整体视觉效果和信息的有效传达。基于网页布局的理念,分析了现代网页布局设计中不足之处,提出优化网页布局的方法,从而设计出既美观又实用的网页。    

10.  Dreamweaver中的表格制作  
   陈丹《辽宁工程技术大学学报(自然科学版)》,2004年第23卷第Z1期
   针对表格在网页中具有控制页面布局、美化网页页面的作用,介绍了 Dreameaver 中实现表格背景变色、表格中实现画中画、用 DW 自动将文本生成表格等方法。给出了网页设计中对制作好的表格预览变形的解决方法和网页制作中使用表格的注意示项。归纳了 Dreamweaver 在网页制作过程中的几大优势。    

11.  基于CSS的网页美化设计研究  被引次数:1
   薛曼君  王国伟  薛勇《科技资讯》,2008年第19期
   以提高网页浏览速度和增加网页视觉效果为目的,在CSS技术的基础上对网页布局设计和网页页面特效进行了美化设计研究,重点分析了CSS样式和HTML结合的方法、DIV+CSS技术实现流行的网页布局,以及CSS滤镜在网页特效中的应用,并进行了具体实例的代码设计。    

12.  一种对动态网页的排名算法及其应用  被引次数:1
   李慧  沈洁  张舒  杨学凯《扬州大学学报(自然科学版)》,2006年第9卷第3期
   针对目前普通搜索引擎无法对动态网页的查询结果进行有效索引与排序的问题,提出了一种对动态网页的排名算法Con ten tR ank,并介绍其在商务网站中的应用.该算法通过对与动态页面相关的内容进行挖掘分析,计算页面排名得分,从而实现对此类动态网页的查询结果的排序,提高排名的准确性.    

13.  网页设计中的视觉传达应用  被引次数:1
   薛曼君《科技资讯》,2010年第12期
   从网页的页面布局和色彩搭配两个方面对网页设计的视觉传达进行了分析和研究。通过对网页的页面元素特点和布局类型介绍,详细地阐述了如何合理进行网站的页面布局,并在此基础上对网页色彩搭配原则和实用的搭配技巧进行了深入的研究。最后结合先进的技术对上述理论知识进行了实际的应用设计。    

14.  浅谈网页布局中的表格与框架  
   徐景秀《科技资讯》,2014年第12卷第18期
   本文简要介绍了页面布局的一般设计原则、设计方法,并主要论述了表格及框架定位页面元素,进行网页布局的方法。    

15.  基于URL类型和网页链接变化的信息采集更新算法  
   陈晓志  董守斌  张凌  张元丰《郑州大学学报(理学版)》,2007年第39卷第2期
   通过观察网站呈现网页的规律及网页本身的结构特点,提出基于URL类型及网页链接变化规律的入口页面识别算法,优先抓取入口页面.在实际应用中,取得了较好的更新效果.    

16.  支持页面特征伪造识别的钓鱼网页检测方法  被引次数:1
   王伟平  张兵《山东大学学报(理学版)》,2014年第9期
   钓鱼网站是指伪装成合法网站,窃取用户提交的账号、密码等私密信息的网站。基于页面特征识别的钓鱼网站检测方法具有较好的识别准确性,但现有方法对页面特征伪造的情况识别较弱,容易漏判。首先分析了大量钓鱼网站的页面代码,总结了常见的9种页面特征伪造方式,并针对性地提出了支持页面特征伪造识别的钓鱼网站检测方法。该方法对页面渲染后再做特征提取识别,在页面渲染过程中检查URL地址跳转的伪装,通过直接操纵DOM提取iframe内嵌页面的内容,去除页面所有隐藏元素以防止钓鱼攻击者伪造页面关键词。测试结果表明该方法能够去除多种伪装,完成页面特征的准确提取,提高检测的准确率。    

17.  基于DIV+CSS的网页定位技术的应用研究  
   卢华《科技信息》,2011年第21期
   DIV+CSS网页布局越来越多的被广泛用于网页设计中,该文通过对CSS盒子模型的介绍,解析了如何使用网页定位技术控制页面中各个元素的位置,并通过一个典型实例说明了各种定位技术的具体应用。    

18.  基于序列比对的动态Web信息抽取算法  
   赵刚  郭东伟  李丹《吉林大学学报(理学版)》,2010年第48卷第3期
   基于对深网(Deep Web)网页公共框架的定义, 提出一种在信息抽取算法中增加公共框架检测阶段, 采用序列比对算法提取公共框架的方法. 与原始网页数据相比, 去除公共框架的数据域信息对模板抽取更有利. 基于真实网站的数据密集型网页集合, 测试和对比了序列比对算法中参数不同取值以及公共框架检测阶段在数据量和抽取准确率等方面对信息抽取算法的影响. 实验结果表明了算法的有效性.    

19.  基于DOM的动态网页信息抽取方法  
   王平根《科技信息》,2010年第31期
   动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成。本文在研究DOM技术与网页结构的基础上,根据动态Web页面的特点,提出了一种基于DOM的动态网页信息抽取方法,并描述了利用DOM技术实现动态网页信息抽取的算法。    

20.  基于分块重要度和二维条件随机场的Web信息抽取  
   吴秦  胡丽娟  梁久祯《南京大学学报(自然科学版)》,2014年第1期
   网页分块方法使得Web信息抽取的单位由原来的页面缩小为分块.结合分块重要度模型与二维条件随机场的优点,提出一种Web对象信息抽取方法.该方法利用分块重要度模型对网页分块进行重要度标注,过滤掉大量与主题无关信息,更加准确的定位待抽取信息的位置.二维条件随机场模型相比传统的线性条件随机场模型更好的适应了网页分块的二维结构,有效的提高信息抽取准确率.实验结果表明,该方法对Web对象信息抽取具有良好的效果.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号