首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于模板检测的违法网站识别方法
摘    要:为高效识别违法网站,该文提出了一种新方法。从HTTP POST提取特征值,计算网站间相似度,对网站进行聚类并抽取违法网站模板用来识别违法网站。应用图挖掘技术过滤合法网站,提升识别效率。以赌博网站为例,在真实环境中对该方法进行了大规模实验和评估。实验结果表明:该方法检测出赌博网站的精确度为1;与URL、HTML和语义特征相比,HTTP POST特征值的F-Measure最好;应用图挖掘技术可以有效过滤合法网站,提高整个流程运行效率20%。


Illegal website identification method based on template detection
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号