首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对金融服务领域面临的严峻信息安全挑战,以及现有钓鱼网页检测方法的不足,提出一种基于支持向量机(support vector machine,SVM)的金融类钓鱼网页检测方法.采用网页渲染去除常见的页面特征伪装,提取统一资源定位符(uniform resource locator,URL)信息特征、页面文本特征、页面表单特征以及页面logo图像特征,构建特征向量训练SVM分类器模型,实现对金融类钓鱼网页的识别.在特征提取过程中,利用适合中文的多模式匹配算法AC_SC(AC suitable for chinese)提高文本匹配效率,并采用加速鲁棒特征(speeded-up robust feature,SURF)算法实现logo图像的特征提取与匹配.多方法实验结果对比表明,该方法针对性更强,能达到99.1%的检测准确率、低于0.86%的误报率.  相似文献   

2.
搜索引擎垃圾网页作弊的检测问题一般被视为一个二元分类问题,基于机器学习的分类算法建立分类器,将网页分成正常网页和垃圾网页2类.现有的基于内容特征的垃圾网页检测模型忽略了网页之间的链接关系,故构建了软间隔支持向量机分类器,以网页的内容特征作为支持向量,根据网页之间的链接具有相似性的特点定义了惩罚函数,使用样本集学习,得出了线性支持向量机网页分类器,并对分类器的分类效果进行了测试.实验结果表明基于支持向量机的分类器的效果明显好于使用内容特征构建的决策树分类器.  相似文献   

3.
为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,构建了XGBoost分类模型,给出了方法的时间复杂度分析,采集了真实数据作为实验数据集.实验结果表明,Logistic回归方法降低了融合特征的维度,检测速度优于直接融合方法;融合特征方法比单方面特征方法含有更多有效的信息,可供分类器进行学习,检测精度高于单方面特征方法,精确度达到96.67%,召回率为96.6%.  相似文献   

4.
为了解决现有的钓鱼网页分析方法,往往基于页面的文本特征,而忽略了页面的结构特征的问题,提出基于文档对象模型(document object model,DOM)结构聚类的钓鱼检测方法,其关键在于如何快速有效地计算网页的相似度。首先对获取的页面进行DOM结构解析,构建DOM树层次标签向量以刻画网页的结构特征;然后重新定义DOM树距离的概念,通过不同DOM树之间的距离来度量网页间的相似度;最后采用划分聚类思想实现网页的聚类。一系列的仿真实验表明,方法具有较高的召回率与精确率,运行时间也较短。  相似文献   

5.
基于特征选择和支持向量机的异常检测   总被引:1,自引:0,他引:1  
为在提高检测率的同时保持较低的虚警率,提出一种不同于单一算法的基于特征选择和支持向量机的异常检测技术.首先用一个数据子集进行特征选择,通过构造函数来计算特征间的相似度,并在不失样本信息的前提下,完成会话样本的特征选择;然后对用于训练和测试的数据执行特征选择,剔除不必要的数据特征;最后利用支持向量机来判断入侵.仿真实验表明:与基于标准的支持向量机、基于tf×idf的支持向量机、基于tf×idf的神经网络及基于数据挖掘等的异常检测相比较,该方法具有更高检测率,同时其虚警率也更低.  相似文献   

6.
为了提高焊缝偏差识别精度,首先对基于旋转电弧传感的焊接电流信号进行小波滤波,预处理后构建样本数据集.然后建立基于支持向量回归机的Laplace特征映射外延算法,对样本数据集和新样本进行维数约简,利用维数约简后的样本数据集训练支持向量回归机,并对新样本进行偏差识别.最后与不进行维数约简而是直接利用支持向量回归机进行偏差识别的方法进行对比试验.结果表明,利用特征映射进行维数约简能使焊缝偏差识别的精度平均提高25%.  相似文献   

7.
随着互联网的迅速发展,人们在浏览网页的时候容易受到网页恶意代码的攻击.针对这些问题,提出了一种基于多策略的网页恶意代码检测方法.对恶意网页代码特征进行分析,通过运用词频统计的方法对网页代码进行特征挖掘,获取关键特征值后,分别利用支持向量机算法、朴素贝叶斯算法、神经网络算法和多策略的算法建立分类模型,设计实验对4种分类模...  相似文献   

8.
支持页面特征伪造识别的钓鱼网页检测方法   总被引:1,自引:0,他引:1  
钓鱼网站是指伪装成合法网站,窃取用户提交的账号、密码等私密信息的网站。基于页面特征识别的钓鱼网站检测方法具有较好的识别准确性,但现有方法对页面特征伪造的情况识别较弱,容易漏判。首先分析了大量钓鱼网站的页面代码,总结了常见的9种页面特征伪造方式,并针对性地提出了支持页面特征伪造识别的钓鱼网站检测方法。该方法对页面渲染后再做特征提取识别,在页面渲染过程中检查URL地址跳转的伪装,通过直接操纵DOM提取iframe内嵌页面的内容,去除页面所有隐藏元素以防止钓鱼攻击者伪造页面关键词。测试结果表明该方法能够去除多种伪装,完成页面特征的准确提取,提高检测的准确率。  相似文献   

9.
网络钓鱼(phishing)是一种在线欺诈行为,普遍存在于电子商务和电子金融中。将黑白名单方法和异常特征检测方法相结合,针对网络钓鱼网站URL异常和页面身份异常特点提出基于敏感特征的网络钓鱼网站检测方法——PhishDetector。使用黑白名单技术对URL进行拦截,对于名单中不存在的URL,提取其敏感特征,然后使用线性分类器判断该网站是否为网络钓鱼网站。实验结果表明,基于敏感特征的网络钓鱼网站检测方法,提高了网络钓鱼网站检测的正确率,显著降低了误判率。  相似文献   

10.
基于敏感特征的网络钓鱼网站检测方法   总被引:1,自引:0,他引:1  
网络钓鱼(phishing)是一种在线欺诈行为,普遍存在于电子商务和电子金融中.将黑白名单方法和异常特征检测方法相结合,针对网络钓鱼网站URL异常和页面身份异常特点提出基于敏感特征的网络钓鱼网站检测方法——PhishDetector.使用黑白名单技术对URL进行拦截,对于名单中不存在的URL,提取其敏感特征,然后使用线性分类器判断该网站是否为网络钓鱼网站.实验结果表明,基于敏感特征的网络钓鱼网站检测方法,提高了网络钓鱼网站检测的正确率,显著降低了误判率.  相似文献   

11.
一种网络入侵检测特征提取方法   总被引:2,自引:0,他引:2  
为了去除冗余特征,降低系统存储和运算负担,提高网络入侵检测分类器的性能,文中提出了一种基于Fisher分和支持向量机的网络入侵检测特征提取方法.针对KDD′99网络入侵检测数据集,应用该方法得到了混合攻击和4种单一攻击模式下的特征重要度排序,选取重要特征建立支持向量机入侵检测分类器.结果表明,该分类器精度与使用全部特征构建的支持向量机分类器相当,训练和测试时间则显著降低.  相似文献   

12.
首先对基于旋转电弧传感的焊接电流信号进行小波滤波,预处理后构建样本数据集。然后建立基于支持向量回归机的Laplace特征映射外延算法,并对样本数据集和新样本进行维数约简,利用维数约简后的样本数据集训练支持向量回归机,并对新样本进行偏差识别。与不进行维数约简而是直接利用支持向量回归机进行偏差识别的方法进行对比实验,表明利用Laplace特征映射进行维数约简能提高焊缝偏差识别的精度。  相似文献   

13.
粗糙集特征选择和支持向量机在入侵检测系统中的应用   总被引:1,自引:1,他引:0  
针对传统的基于特征检测的入侵检测系统处理的数据常含有大量的冗余特征,使得系统的特征提取和后续处理消耗大量系统资源,导致实时性差,影响检测效果的问题,文章利用粗糙集理论进行特征约简,消除冗余和噪音特征并基于精简后特征子集训练支持向量机,再由训练后的分类器进行入侵检测的方法,以达到提高入侵检测系统的实时性能。实验结果表明了该方法的有效性。  相似文献   

14.
针对信用卡诈骗犯罪侦查工作中可疑交易识别问题,提出一种可疑交易检测方法,测试了不同参数环境下属性重要性的敏感性,采用随机森林方法进行特征选择,设计了可疑交易检测的模型.采用一组真实的信用卡交易数据对所提出的方法进行了实验,并与逻辑回归和支持向量机方法进行了比较分析.实验结果表明:所提出的基于随机森林的检测方法在综合指标...  相似文献   

15.
基于Lasso回归和支持向量机分类器,首先利用Lasso回归具有变量筛选的特点,过滤部分不重要的特征,然后利用支持向量机分类器做情感提取.在某化妆品品牌的评论数据实验中,利用基础情感词典和领域情感词典构建待选择高维特征集,通过对比特征选择前后的G-means,精确度和召回率等,均取得显著效果.  相似文献   

16.
提出了一种基于支持向量机的快速高光谱分类方法.首先采用基于主成分分析和Bhattacharyya距离的方法进行特征降维,然后通过二叉树的支持向量机(Binary tree of SVMs,BTS)来减少一次分类所需的两类支持向量机个数,最后采用简化支持向量技术进一步减少支持向量的数量.实验采用真实高光谱数据,并与4种其他方法进行比较.结果表明,该方法能有效地加快分类速度.  相似文献   

17.
为提高支持向量机集成的泛化性能,提出一种基于独立成分分析法的特征Bagging支持向量机集成方法,删除了冗余特征.该方法从得到的独立成分特征空间中提取特征子空间,避免了直接从原特征空间中随机选择特征子空间而导致的对特征依赖或相关性的破坏,提高了个体支持向量机的性能,保证了个体支持向量机之间的差异度.在UCI和Stat-Log数据集合上的仿真实验表明,该方法具有更好的泛化性能.  相似文献   

18.
基于支持向量机的特征选择   总被引:1,自引:1,他引:0  
主要研究了基于支持向量机的特征选择方法——特征权法,通过对两组数据进行试验,说明了特征权法在分类效果上优于F-得分法和支持向量机.  相似文献   

19.
针对传统支持向量机对噪声或野值样本敏感和忽略样本各个特征对分类精度的不同影响,提出了一种具有特征有效度的模糊支持向量机(FW-FSVM).该方法通过对模糊支持向量机的模糊因子进行改进,将噪声或野值样本与有效样本进行区分.在此基础上根据信息增益计算样本各个特征的特征有效度,消除弱相关特征和冗余特征对分类精度的影响,从而构...  相似文献   

20.
随着海量网页信息的出现,网页分类已经成为数据挖掘领域的一个重要研究方向,网页分类是一种快速有效利用海量网页信息的重要技术.为了克服支持向量机进行网页分类时存在训练收敛较慢和分类精度不高的缺点,将改进的量子粒子群优化算法与支持向量机相结合,提出了一种融合改进量子粒子群算法和支持向量机的网页分类方法.首先引入柯西分布改进量子粒子群优化算法,其次利用改进的量子粒子群算法优化支持向量机的参数选择,然后利用支持向量机进行网页分类.实验结果表明,该方法具有较高的准确率、召回率和F1测试值,网页分类效率也得到了一定程度的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号