共查询到20条相似文献,搜索用时 69 毫秒
1.
互联网应用的蓬勃发展产生了种类多样的网络流量。在网络技术不断进化的过程中,新型流量和流量加密技术的出现,使基于端口和基于有效载荷的传统网络流量分类算法的应用受到限制。为了实现对新型网络流量的自动分类,提出了一种基于机器学习的网络流量分类算法。通过选择特征属性和构建决策树模型,能够实现对流量级别的网络数据进行自动分类。使用网络流量分类领域的公开数据集进行训练和测试,并将测试结果与开源的机器学习平台Weka运行结果相比较,实验结果表明:所构建模型性能优良,在流量分类准确度与Weka平台相近甚至更优的前提下,大幅降低了建模时间,提高了网络数据分类的效率。 相似文献
2.
提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类。 相似文献
3.
本文以青海花儿唱词为研究对象,采用朴素贝叶斯机器学习模型和长短期记忆网络(LSTM)机器学习模型对其建模.首先对青海花儿唱词进行收集,建立模型并对收集到的唱词进行特殊的预处理操作,利用Word2vec生成词向量模型,构建二种不同的机器学习算法模型:朴素贝叶斯模型和LSTM神经网络+Word2vec模型;其次划分花儿唱词... 相似文献
4.
朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析 总被引:3,自引:0,他引:3
詹毅 《成都大学学报(自然科学版)》2013,32(1):50-53
为分析对比朴素贝叶斯算法和SVM算法在Web文本分类中的效率及其适用的范围,构建了一个Web分类系统,此分类系统将已分类的Web网页作为训练集,利用分类算法构建Web分类器,通过Web测试集评价两类算法在Web文本分类中的性能体现,为Web文本分类算法选择提供一定的参考依据. 相似文献
5.
基于朴素贝叶斯的垃圾邮件分类系统的设计 总被引:1,自引:0,他引:1
徐治国 《盐城工学院学报(自然科学版)》2008,21(2):47-50
结合垃圾邮件分类系统的具体要求,在传统规则分类方法的基础上引入机器学习的知识,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法,并详细讨论了一个基于朴素贝叶斯方法的个性化垃圾邮件分类系统的设计。提出的分TFIDF特征子集提取算法和朴素贝叶斯方法对邮件进行分类具有较好的分类精度,应用朴素贝叶斯方法在新邮件到达的同时对其进行分类,具有较好的分类速度。 相似文献
6.
基于相关系数的加权朴素贝叶斯分类算法 总被引:7,自引:0,他引:7
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性. 相似文献
7.
面对近年来不断增长的网络带宽压力,常见的基于端口和负载内容的网络流量分类系统,已经越来越难以满足大流量环境下的检测需求,而基于流行为特征的方法由于其难以规避性,正得到越来越多的重视.文中运用了基于流行为特征的流量分类方法,将几种具有较高区分度的特征引入特征向量中,采用K-Means进行初步聚类.实验证明,该方法产生了很... 相似文献
8.
预测大盘指数的涨跌幅度在股票投资中具有重要的意义。大盘指数的涨跌既与国家的宏观经济政策有关,也与大盘指数自身运行状态有关。结合朴素贝叶斯分类算法和股票大盘指数涨跌的影响因素建立了大盘指数分类预测模型,以上证指数为例进行了实验,结果表明分类预测模型有效,准确性较高。 相似文献
9.
针对文本分类问题,将朴素贝叶斯分类与自组织特征映射网络分类相结合,提出了基于相对特征的文本分类算法.该算法具有很快的速度和较高的准确率,从而为构建高效的搜索引擎提供支撑. 相似文献
10.
11.
网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE (synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%~20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用. 相似文献
12.
提出一种基于马氏超椭球学习机的多类文本分类算法。对每一类训练样本,训练马氏超椭球学习机,使其包含该类尽可能多的样本,同时将噪音点排除在外。对于待分类样本,通过待分类样本的映射到每个超椭球球心的马氏距离确定其类别。实验结果表明,该算法提高了分类精度和分类速度。 相似文献
13.
14.
15.
对公交网和道路交通网进行预处理,提出了出行网的概念,给出了相应的构造算法,出行网为后续选路算法的实现提供高效平台.基于所提出的出行网,在综合考虑换乘次数、出行距离、出行耗时以及步行换乘等多约束条件下,提出了一种高效的出行线路选择算法——BRC(Best Route Chioce)算法.该算法可通过调节系统参数求得不同目标条件以及综合目标条件下的最优乘车方案.理论分析表明,所提出的算法是可行的,算法正确性也得到了证明. 相似文献
16.
D-FNN基本思想是构造一个基于扩展的RBF神经网络,它可以看成是一个TSK模糊系统,也可以看做是基于归一化的高斯RBF神经网络。该文提出的算法,学习前,模糊神经网络不需要预先确定,在学习的过程中,参数估计与结构辨识同时进行,并根据系统精度要求及模糊规则的重要性,自动地产生或者删除一条模糊规则。在学习速度、系统结构和泛化能力方面进行了仿真实验,仿真结果表明D-FNN具有更简洁的结构和优良的性能。 相似文献
17.
18.
比特币是一种去中心化的电子加密货币,交易地址的匿名性隐藏了交易用户的真实身
份,导致比特币被一些不法分子应用于各类非法活动中。通过分析已知实体的交易属性和行为特
征,利用机器学习的方法可以对未知实体的交易类别进行预测。本文首先概述了比特币实体类别
及分类标签的来源;其次,分析和归纳了基于机器学习的比特币实体分类方法;最后,分析了现阶
段面临的主要问题,并对未来的发展趋势进行了展望。 相似文献
19.
针对计算机网络规模滞后、服务类型单一和服务质量没有保证等问题,将网络规划(网络改进)与流量工程作为有机整体为网络业务流量提供QoS服务,并在此基础上提出基于流量工程的新型网络改进算法.算法运用构造Harafy图和网络扩充启发式算法保证拓扑约束,基于多QoS约束路由算法满足流量工程约束;并使用改进遗传算法策略全局寻求改进费用最小网终及容量分配.仿真结果表明:算法实现最小化新增链路,使改进后拓扑仅略大于理想拓扑(Harary拓扑),88%的流量通过少跳数传输,且各链路带宽分配均匀(均方差σ=1.1).从而使算法在满足各网络约束的同时能够有效地均衡网络负载,避免链路拥塞,提高网络运行性能. 相似文献
20.
针对传统文本分类方法中出现的维度过高和数据稀疏问题,通过对卷积神经网络(Convolutional Neural Network,CNN)和 inception V1 模型的深入研究,将两个模型融合起来,提出了一种基于 i-CNN 模型的 邮件分类方法;在卷积、池化操作中加入了 1×1 卷积核降低特征向量的厚度,减少了参数,提高了计算性能; 通过数据验证,i-CNN 模型对邮件的分类结果高达 92. 18%,在对比实验中,i-CNN 模型相对于几种机器学 习分类模型,取得了最高的分类精准率,在有无 inception 结构模型对比中,i-CNN 模型精准率高于 CNN 模 型;说明该模型具有较好的分类效果,且 inception V1 模型的融入能提高文本分类的准确率。 相似文献