基于可视布局信息的网页噪音去除算法 |
| |
引用本文: | 荆涛,左万利.基于可视布局信息的网页噪音去除算法[J].华南理工大学学报(自然科学版),2004,32(Z1):84-87. |
| |
作者姓名: | 荆涛 左万利 |
| |
作者单位: | 吉林大学,计算机科学与技术学院,吉林,长春,130012 |
| |
基金项目: | 国家自然科学基金资助项目(60373099) |
| |
摘 要: | 主要探讨了网页中的噪音去除问题.针对单一页面中包含的丰富的可视信息,提出了一个更加精确的噪音去除算法首先获得页面中各元素标记的布局信息,然后利用布局信息对页面进行划分,最后在此基础上去除噪音.与采用"布局信息"的算法相比.本文提出的算法对页面布局信息的提取更加准确,并能处理动态HTML页面.实验结果表明,该算法优于同类算法,可有效地去除网页噪音.
|
关 键 词: | 网页 噪音 页面布局 |
文章编号: | 1000-565X(2004)S-0084-04 |
修稿时间: | 2004年8月30日 |
An Algorithm for the Elimination of the Noise in Web Pages Based on Visual Layout Information |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|