首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提出了一种基于深度学习的CNN-LSTM-Concat快速DGA域名分类算法,使用多层一维卷积网络对域名字符进行序列化处理,LSTM网络层用于强化获取字符间长距离依赖关系。通过将LSTM的多序列输入转化为单向量输入,在保证检测性能的前提下,能够大幅提高训练和检测速度。实验证明,我们的方法对DGA域名分类的准率在公开数据集上达到98.32%。同时,在准确率相比主流的LSTM方法更高的情况下,检测时间比LSTM方法快6.41倍。  相似文献   

2.
当前攻击者广泛采用域名生成算法(DGA)生成大量的随机域名来躲避检测.针对现有的DGA域名检测模型均是在已经公开的数据集上进行训练构建,无法对未知恶意域名进行有效检测的情况,利用真实域名数据训练自编码器,并将自编码器和生成对抗网络相结合,构造了一种新的DGA域名生成模型.实验表明,该模型产生的序列与Alexa域名在长度和字符分布等特征都很接近,而且能够有效降低基于长短期记忆网络的DGA域名分类器的性能.这些生成序列很好地丰富了恶意域名数据集,对其进一步利用,显著提升了现有DGA域名检测器的性能.  相似文献   

3.
马永忠  夏保丽 《广西科学》2023,30(1):139-148
针对现有僵尸网络检测方法检测精度不高和检测时间开销较大的问题,提出一种基于改进Transformer和强化学习的僵尸网络域名生成算法(Domain Generation Algorithm,DGA)的域名检测方法。首先,利用深度可分离卷积替换ResNet和ResNeXt网络中的卷积块,通过减少网络模型参数来降低模型的时间开销;其次,利用改进后的ResNet和ResNeXt网络将域名字符串映射到深度特征空间,构造多尺度特征,强化特征的表达能力;再次,利用长短期记忆神经网络(Long Short-Term Memory,LSTM)对Transformer网络进行改进,在保持字符间相对位置的同时,进一步建立上下文的长距离依赖编码,并在此基础上引入注意力机制,强化模型对关键特征的捕获能力;最后,引入强化学习对模型进行微调,提高DGA域名的检测精度。在多个DGA域名数据集上进行测试验证,结果表明该模型在保持检测时间开销较小的基础上,具有更高的检测精度。  相似文献   

4.
在比较恶意代码的分析技术的基础上,将自相似特性技术引入恶意代码的动态分析中。跟踪同类型的恶意程序,采集API函数的调用序列,提取关键特征信息,得到时间调用序列,并进行归一化处理。通过重新标度权差分析算法、回归方差算法和Higuchi算法,分别计算程序的Hurst指数,匹配同种恶意程序的自相似性。将恶意程序与正常程序的API调用序列和Hurst指数进行对比实验表明,恶意程序调用API函数与正常程序存在差异,并且同一类型的恶意程序确实具有自相似性,从而能够动态检测出恶意程序。  相似文献   

5.
针对维吾尔词书写粘连和手写笔画漂移等问题,提出一种基于多信息融合路径寻优的字符分割算法.利用笔画提取、切分和聚类,过分割单词图像得到主体和附加字段,通过字段模糊匹配获得鲁棒的字根序列描述,以抑制笔画漂移造成的干扰;由建立的匹配位置高斯模型来估算字段匹配信息,经对单字分类器输出进行置信度转换,从而得到字符识别信息,再运用数据统计获取单词语义信息;由构建的字符序列二阶Markov语言模型,基于Bayes准则,提出了单词后验概率的多信息加权融合计算方法,通过字段匹配及字根合并的路径寻优,可得到最佳字符分割结果.在手写维文样本库上的实验表明,所提算法能有效提升字符分割的准确率和稳定性.  相似文献   

6.
根据评论内容的特性,提出了一种基于主题-对立情感依赖模型(topic-opposite sentiment dependency model,TOSDM)的虚假评论检测方法。首先构建TOSDM模型,利用该模型提取评论的主题信息以及主题对应的情感信息;然后结合评论的主题以及情感信息,分析并提取6维评论内容特征;最后利用这些评论内容特征,采用有监督学习的分类器对虚假评论进行检测。在大众点评网获取的2009-2012年的5个领域的评论数据集上进行了实验,实验表明,提取评论主题信息以及主题对立情感信息能够提高虚假评论的检测效果,TOSDM的虚假评论检测效果优于其他模型。  相似文献   

7.
DGA域名(Domain Generation Algorithm)检测是恶意CC通信检测的关键技术之一。已有的检测方法通常基于域名构成的随机性进行检测,存在误报率高等问题,对于低随机性DGA域名的检测准确率较低,主要是因为此类方法未能有效提取低随机性DGA域名中的部分高随机性,为此提出了域名的多字符随机性提取方法。采用门控循环单元(GRU)实现多字符组合编码及其随机性提取;引入注意力机制,加强域名中部分高随机性特征。构建了基于注意力机制的循环神经网络的DGA域名检测算法(ATT-GRU),提升了低随机性DGA域名识别的有效性。实验结果表明,ATT-GRU算法在检测DGA域名上取得了比传统方法更高的检测精确率和更低的误报率。  相似文献   

8.
域名解析作为网络建立连接的第一个步骤,对恶意域名进行快速识别是阻断异常网络行为的有效措施。本研究利用机器学习和随机搜索算法,提出了一种基于SVM-RFE和粒子群优化算法的恶意域名检测模型。分析域名字符特征、解析特征和注册特征,使用SVM-RFE算法进行特征权重排序,通过优化的粒子群算法确定最佳SVM参数和特征选择。实验证明该检测模型具有较好的效率和准确度。  相似文献   

9.
有些文本缺少字符集信息,因而阻碍了字符信息的正确解析.为了获得字符集信息可以根据文本中字符信息的统计特征以及各种字符集之同的差异来识别出文本的字符集.集成的字符集检测方法通过综合应用编码模式检测方法、字符分布方法和双字符序列检测方法来检测字符集.它根据算法复杂度和每种算法的准确率来调度算法.使得在用一种方法不能确定字符集的情况下利用其它方法来检测出字符集实验结果表明:集成的字符检测技术具有较高的准确率.集成的字符检测方法在某些情况下通过适度增加一些时间来获得较高的精度.  相似文献   

10.
近年来,网络安全问题层出不穷,其中僵尸网络是造成网络瘫痪的重要原因之一。僵 尸网络利用域名生成算法(DGA)生成大量恶意域名进行网络攻击,对网络安全造成威胁。现有的 DGA域名主要分为字典型和字符型,传统的深度学习方法无法同时检测出两种类型的DGA域名, 尤其是无法检测出基于字典的DGA域名。针对这个问题,本文提出了改进的CNN-LSTM的DGA 域名检测算法,该算法融合了卷积神经网络(CNN)、注意力机制和双向长短时记忆网络(BiLSTM), 可以同时检测出两种类型的DGA域名。最后进行了不同算法的对比实验,实验结果表明,与其他 深度学习模型相比,该算法提高了DGA域名的二分类和多分类的准确率和F1值。在多分类实验 中,通过改进损失函数,提高了小样本数据的域名检测率。  相似文献   

11.
尚淑玲  丁汀 《科技信息》2012,(23):87-88
图形验证码已成为许多网站系统常用的一种防止恶意程序自动注册或登录、恶意灌水等网络攻击的工具,但当前的图形验证码容易被恶意程序识别,甚至有时用户很难辨别验证码中的验证字符信息。本文详细论述了一种基于ASP.NET的安全、可靠的验证码生成方法,并给出了源代码。  相似文献   

12.
针对使用域名生成算法(DGA)僵尸网络隐蔽性强,传统检测算法特征提取复杂的问题,提出一种无需提取具体特征的深度学习模型DGA域名检测方法.首先基于word-hashing将所有域名转用二元语法字符串表示,利用词袋模型把域名映射到高维向量空间.然后利用5层深度神经网络对转换为高维向量的域名进行训练分类检测.通过深度模型,能够从训练数据中发现不同层次抽象的隐藏模式和特征,而这些模式和特征使用传统的统计方法大多是无法发现的.实验中使用了10万条DGA域名和10万条合法域名作为样本,与基于自然语言特征分类算法进行对比实验.实验结果表明该深度模型对DGA域名检测准确率达到97.23%,比基于自然语言特征分类算法得到的检测准确率高3.7%.  相似文献   

13.
基于多尺度模板匹配和部件模型的车牌字符分割方法   总被引:2,自引:0,他引:2  
为提高车牌字符分割的准确率,提出了一种基于多尺度模板匹配和部件模型的车牌字符分割方法. 对单层车牌,根据车牌结构特征建立多尺度模板作用于车牌候选区域,通过投影得分估计出最佳模板对应的尺度和位置信息;对双层车牌,使用部件模型对双层车牌进行建模,双层车牌的上层字符区域和下层字符区域分别对应部件模型的一个部件,通过多尺度的模板匹配得到上下层部件的候选集合,利用部件模型中部件之间的几何约束得到最终的车牌字符分割结果. 实验结果表明,所提出的方法可以有效进行单/双层车牌的字符分割.   相似文献   

14.
针对经验模态分解(EMD)能有效地对信号结构作出精确分辨的特点,提出了一种基于小波变换和EMD的手写体数字字符特征表示方法.首先对原始数字字符进行G小波变换极大模预处理,得到能反应字符特征信息的光滑轮廓;然后对规范轮廓曲率序列作EMD分解,以获取浓缩曲率特征的主要信息;最后对此曲率特征数据进行聚类和识别.实验结果表明,与经典的字符特征提取算法相比,文中方法具有更好的聚类效果,提高了分类器的分类设计能力.  相似文献   

15.
法律文书命名实体识别是智慧司法的关键任务。现有的序列标注模型仅关注字符信息,导致在法律文书命名实体识别任务中无法获得语义和词语的上下文信息,且无法对实体的边界进行限制。因此,该文提出了一个融合外部信息并对边界限制的司法命名实体识别模型(semantic and boundary enhance named entity recognition, SBENER)。该模型收集了40万条盗窃罪法律文书,首先,预训练模型,将获得的司法盗窃罪词向量作为输入模型的外部信息;其次,设计Adapter,将司法盗窃罪的信息融入字符序列以增强语义特征;最后,使用边界指针网络对实体边界进行限制,解决了序列标注模型丢失词语信息及缺少边界限制的问题。该模型在CAILIE 1.0数据集和LegalCorpus数据集上进行实验,结果表明,SBENER模型在2个数据集上的F1值(F1-score)分别达88.70%和87.67%,比其他基线模型取得了更好的效果。SBENER模型能够提升司法领域命名实体识别的效果。  相似文献   

16.
针对仪表数字字符图像识别中存在角度倾斜和非整字的不确定因素,提出一种基于灰色关联度的仪表数字字符识别方法.通过构建硬度特征序列,将字符特征信息中的不确定信息当作"灰信息",利用灰色理论中的灰色关联分析法,分析待测字符特征序列和训练集样本的特征序列之间的相关程度,将最大关联度对应的样本字符作为识读结果.实验结果表明,该算...  相似文献   

17.
基于DNA序列的信息隐藏   总被引:1,自引:0,他引:1  
研究了以DNA序列为载体的信息隐藏,提出了一个信息隐藏算法.该算法首先将秘密信息经预处理、编码、调制变成一维随机DNA序列;然后由一个随机数序列决定隐藏信息在载体的高复杂性区域的位置;最后在隐藏信息的位置,秘密信息字符替代载体字符.由该算法实现的信息隐藏既具有一定的稳健性和安全性,又符合生物学意义.实验结果也证明了该算法的有效性.  相似文献   

18.
针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。  相似文献   

19.
在虚假信息识别任务中,面对图文结合的虚假内容,基于单模态的模型难以进行准确识别.社交媒体中的虚假信息为吸引关注和迅速传播的目的,会使用夸张的词汇煽动读者的情绪.如何将情感特征引入多模态虚假信息检测模型进行多特征融合,并准确地识别虚假信息是一个挑战.为此,本文提出了基于注意力机制多特征融合的虚假信息检测方法(att-MFNN).该模型中先将文本特征和情感特征基于注意力机制融合,再与视觉特征组成多模态特征送入虚假信息识别器和事件分类器中.通过引入事件分类器学习不同事件中的共同特征,提高新事件的识别性能.att-MFNN在微博和推特(Twitter)数据集的准确率达到了89.22%和87.51%,并且F1、准确率、召回率指标均优于现有的模型.  相似文献   

20.
针对锂电池喷码字符检测定位问题,提出一种基于机器视觉的定位方法.该方法首先根据锂电池图像的特点采用梯度特征对喷码字符区域进行初定位,然后通过倾斜校正得到精细定位后的字符区域.在此基础上,将阈值分割后的字符图像与形态学膨胀后的Canny边缘图像进行逻辑与操作,得到待投影字符区域,最后将待投影字符区域进行垂直和水平两次投影得到单个字符的位置信息,完成字符的检测定位.实验结果表明所研究的方法可以较好的实现对单个喷码字符的精确定位,具有一定的应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号