基于改进TF-IDF的多态蠕虫特征自动提取算法 |
| |
引用本文: | 王方伟,杨少杰,赵冬梅,王长广.基于改进TF-IDF的多态蠕虫特征自动提取算法[J].华中科技大学学报(自然科学版),2020,48(2):79-84. |
| |
作者姓名: | 王方伟 杨少杰 赵冬梅 王长广 |
| |
作者单位: | 河北师范大学河北省网络与信息安全重点实验室,河北 石家庄 050024;河北师范大学计算机与网络空间安全学院,河北 石家庄 050024 |
| |
基金项目: | 国家自然科学基金;河北省自然科学基金;河北省人才工程培养资助项目;河北省高等学校百名优秀创新人才支持计划 |
| |
摘 要: | 提出一种基于改进词频-逆文档频率(TF-IDF)的多态蠕虫特征自动提取算法.首先,利用特征哈希方法对不同位置的子串赋予不同的位置权重,且把高维子串向量压缩成低维向量提高效率;其次,引入校验值对传统IDF算法进行修正,减小稀有子串的权重;最后,按权值排序得到子串序列,生成最终蠕虫特征.利用多类多态蠕虫样本对该算法进行测试,并与已有方法进行比较.实验结果表明:该算法在噪声干扰下能准确高效地提取出多态蠕虫特征,准确性和效率均优于已有方法,并可对特征提取进行状态保存,具有良好的可扩展性.
|
关 键 词: | 多态蠕虫 特征提取 词频-逆文档频率 蠕虫检测 入侵检测系统 |
Automated signature generation algorithm for polymorphic worms based on improved TF-IDF |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
|