基于改进的网络蜘蛛算法抽取Web站点结构的方法 |
| |
引用本文: | 刘继红,吴军华,任明鑫.基于改进的网络蜘蛛算法抽取Web站点结构的方法[J].江南大学学报(自然科学版),2009,8(5):555-559. |
| |
作者姓名: | 刘继红 吴军华 任明鑫 |
| |
作者单位: | 南京工业大学,电子与信息工程学院,江苏,南京,210009 |
| |
摘 要: | 针对传统的Web站点结构恢复方法的局限性,提出了一种基于改进的网络蜘蛛算法的Web结构抽取方法,并实现了相应的工具WebAnalyzer。该方法通过深度优先搜索策略递归遍历Web站点,同时对网页的语法、标签进行分析,提取词法信息,在此基础上形成Web结构视图和词法表。实验表明,该方法能够快速准确地恢复Web站点结构图。
|
关 键 词: | Web应用 逆向工程 静态分析 结构抽取 |
Method of the Web Structure Recovery Based on the Improved Spider Algorithm |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|