基于机器学习的网络流量分类算法 |
| |
作者姓名: | 吕品 潘思羽 许嘉 李陶深 |
| |
作者单位: | 广西大学 计算机与电子信息学院,广西 南宁 530004;广西多媒体通信与网络技术重点实验室,广西 南宁 530004;广西高校并行与分布式计算技术重点实验室,广西 南宁 530004;广西大学 计算机与电子信息学院,广西 南宁 530004;广西大学 计算机与电子信息学院,广西 南宁 530004;广西高校并行与分布式计算技术重点实验室,广西 南宁 530004 |
| |
基金项目: | 国家自然科学基金;广西自然科学基金;广西自然科学基金;广西八桂学者建设工程专项;广西大学科研基金资助项目;广西大学科研基金资助项目 |
| |
摘 要: | 互联网应用的蓬勃发展产生了种类多样的网络流量。在网络技术不断进化的过程中,新型流量和流量加密技术的出现,使基于端口和基于有效载荷的传统网络流量分类算法的应用受到限制。为了实现对新型网络流量的自动分类,提出了一种基于机器学习的网络流量分类算法。通过选择特征属性和构建决策树模型,能够实现对流量级别的网络数据进行自动分类。使用网络流量分类领域的公开数据集进行训练和测试,并将测试结果与开源的机器学习平台Weka运行结果相比较,实验结果表明:所构建模型性能优良,在流量分类准确度与Weka平台相近甚至更优的前提下,大幅降低了建模时间,提高了网络数据分类的效率。
|
关 键 词: | 机器学习 流量分类 决策树 信息熵 属性选择 |
本文献已被 CNKI 万方数据 等数据库收录! |
|