共查询到20条相似文献,搜索用时 125 毫秒
1.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。 相似文献
2.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。 相似文献
3.
高屹 《甘肃联合大学学报(自然科学版)》2014,28(3):49-53,73
僵尸网络已成为目前互联网安全所面临的严重威胁之一.经过10余年发展,僵尸网络已从使用传统的IRC协议向HTTP协议进行转变,给检测及防御等方面造成了诸多困难.通过分析基于HTTP协议僵尸网络所产生流量,在得出相关TCP协议统计信息、僵尸活动的间隔时间等特征的基础上,提出将快速学习神经网络模型(Extreme Learning Machine,ELM)用于识别和检测HTTP僵尸网络.实验表明,该方法能有效从网络流量中检测出BlackEnergry,Bobax等HTTP僵尸网络.与决策树C4.5、SVM算法及传统的BP算法相比较,该方法具有较高的识别率和较低的误报率. 相似文献
4.
为解决社区挖掘问题,针对社会网络的动态特性,给出了新的社区定义,并结合连通性和频繁性概念提出一种新的算法DCSMA(Dynamic Community Structure Mining Algorithm)。挖掘时刻连通的个体集合作为社区,采用层状结构模型,根据重要性权重区分社区内个体,使社区结构更加清晰。在标准测试数据集上的实验结果表明了该算法的可行性和有效性。 相似文献
5.
提出的新算法对gSpan算法做了适用性改进,算法所采用的图编码技术与传统的频繁子图挖掘(FSG),快速频繁子图挖掘(FFSM),基于先验的图挖掘(AGM)等算法对图结构的编码均不同,由于对有向图进行了新的二维特征定义,因此可使算法适用范围有效地扩展至对有向图的学习,称之为基于对gSpan改进的有向频繁子图挖掘算法(DF... 相似文献
6.
针对大部分频繁子图挖掘算法,基于无向图而不适用于更具有实际意义的有向图的挖掘的现状,通过对无向图挖掘算法gSpan中编码结构的扩展,采用改进的规范形式,使编码适用于有向图领域。并使用针对有向图的DADI++存储结构来存储图集,简化了数据访问操作的代价。另外在挖掘中使用Hash表存储同构图的Hash地址和支持度,避免对图集的重复扫描和直接的同构测试。在实际数据集上运行的实验结果表明提出的Dspan算法是正确的,并比FFSM算法效率更高。 相似文献
7.
孙士新 《邵阳学院学报(自然科学版)》2014,(3):20-26
信息获取已成为药商经营活动的重要组成部分和市场判断依据,网络大量非结构化、半结构化信息的出现为药商个性化服务提供了技术空间和实证依据.文章通过对个性化服务中文本挖掘的关键技术进行设计,并应用了中药材信息网站文本挖掘流程,把文本挖掘技术应用于中药材信息网站的用户兴趣获取实例中,实现用户兴趣的自动获取功能. 相似文献
8.
用户发布的微博内容能够体现用户兴趣,微博中用户的转发、评论、回复、他人评论等微博行为对用户兴趣具有很强的指导作用。为了有效利用用户微博行为,提出了一种基于有指导LDA(latent dirichlet allocation)的微博内容用户兴趣建模方法。首先通过分析对微博的转发、评论、回复、他人评论这4个因素对用户微博兴趣主题的影响,定义了4种约束关系;然后基于用户微博内容,将4种约束关系融合到LDA 模型中构建有指导的LDA微博主题生成模型,最后得到用户的微博主题分布,从而获得用户兴趣模型。实验结果表明,相比LDA模型,该方法的准确率有很大提高,引入4种信息对微博用户兴趣发现有非常重要的指导作用。 相似文献
9.
以僵尸网络为平台的攻击发展迅速,其控制协议与结构不断演变,基于P2P协议的分布式结构僵尸网络得到快速发展.现有的P2P僵尸网络检测技术大都通过分析历史网络流量信息来进行离线检测,很难保证检测结果的准确性,也较难满足实时性需求.针对这种情况,提出P2P僵尸网络快速检测技术,首先采用一种改进的增量式分类技术,在线分离出满足P2P协议的网络流量;然后利用P2P僵尸主机的通信模式具有行为相似性和周期性的特点,通过动态聚类技术和布尔自相关技术,快速检测出可疑僵尸主机.实验结果表明该技术能够高效实现P2P僵尸网络的快速检测. 相似文献
10.
在众多社区挖掘算法中,标签传播算法因为接近线性时间复杂度被广泛应用,但其也存在大量随机性,稳定性差的问题,采取一种新型的多标签策略解决重叠社区挖掘问题,并根据节点度减少初始标签赋予量的方法提升了算法的稳定性. 相似文献
11.
针对当前基于节点的动态网络社团结构发现算法难以发现稳定的社团结构的问题,提出了一种采用链路聚类的动态网络社团发现算法(LDC)。该算法首先从链路的角度得到网络的链路图结构;然后对比不同时刻的链路图结构,将动态网络中节点的添加与移除以及边的添加与移除等复杂的变化信息简化为链路添加和链路移除2种增量变化信息;再在前一时刻社团结构的基础上以改进的链路划分密度函数对增量变化信息中变化的链路进行处理,判断该链路是否加入到社团中从而得到最优的社团结构;最后将得到的链路社团转化成为最终的节点社团结构。实验结果表明,相比于当前基于节点的动态社团发现算法,LDC算法能够有效地发现网络中结构稳定的社团结构,其模块度值和标准化互信息值至少提高了0.19和0.13,且算法的运行效率要明显优于基于节点的动态社团发现算法。 相似文献
12.
石杰 《烟台大学学报(自然科学与工程版)》2015,(2):113-118
频繁模式挖掘是数据挖掘领域中一个重要的研究方向,目前已有很多算法被用于挖掘频繁模式.本文在研究FP-growth算法的基础上,提出一种新的频繁模式挖掘算法——QFP算法.首先对每一个频繁项建立一棵QFP树,进而根据设定的条件对每棵树进行挖掘,直到找出符合条件的频繁模式.实验证明该算法能够减少条件子树的生成数量,降低对内存空间的依赖和CPU的计算时间,从而提高关联规则挖掘的效率. 相似文献
13.
一种提取关联规则的数据挖掘快速算法 总被引:8,自引:0,他引:8
提出了一种从大型数据库中挖掘关联规则的快速算法。该算法以典型的Apriori和DHP算法为基础,提出了中间检查点、等从项目类等概念,并对Apriori中的Apriori-gen算法进行了改进。结果表明,它较Apriori有明显的提高。 相似文献
14.
针对目前局部回归神经网络动态BP算法的误差导数计算复杂、收敛速度慢的缺陷,提出了一种新的快速算法、该算法是将信号流图引入动态BP算法,较好地解决了求导数的复杂性,同时采用BFGS算法另快了网络的收敛速度仿真结果表明了本算法的有效性。 相似文献
15.
超圆环面的一种快速路由算法 总被引:1,自引:0,他引:1
利用环状网络(Loop networks)到超圆环面的两种嵌入及环状网络的最优路由算法。给出了一种新的超圆环面的快速路由算法,其时间复杂性仅为O(D)(这里D为网络的直径)。当r≥2时,此算法得到的任两个结点的路径长度path_long≤[cr/2] [kc/2] 1.特别地,当r≥2,c≥8时,path_long≤D 1。 相似文献
16.
传统的社团发现算法大多存在划分效果和复杂度相矛盾的问题,为了解决该问题,提出一种新的单社团结构评价标准——社团密合度(group density).在此基础上,设计了一种基于凝聚思想的社团发现算法,该算法通过不断融合小社团,使网络的社团结构向平均社团密合度最大的方向发展,并使用模块度检测算法的划分结果.通过与经典的GN,Fast Newman,LPA等算法对多个数据集进行实验对比,验证了本文算法在获得较好的划分效果的同时具有较低的时间复杂度. 相似文献
17.
传统的基于用户的协同过滤(User-based CF)推荐算法的推荐效率随着数据的不断增加而降低.本文在User-based CF算法中引入二分网络社团发现理论,提出一种基于二分网络社团划分的推荐算法(RACD).首先通过用户与项目之间的关系建立用户-项目二分网络,然后通过RACD对该网络进行社团划分,得到用户的社团信息,最后通过同一社团中的其他用户对目标用户进行项目的推荐.在经典网络数据集上的实验结果表明,RACD能够有效提高推荐系统实时推荐效率. 相似文献
18.
针对序列模式挖掘中, 频繁子序列个数随模式长度增加而爆炸性增长的问题, 提出一种从序列数据库中挖掘最大频繁序列模式的新算法(MFSPAN). MFSPAN充分利用不同序列可能具有相同前缀的性质来减少项集比较次数. 在标准测试数据集上的实验结果表明了MFSPAN的有效性. 相似文献
19.
20.
利用环状网络到超圆环面的两种嵌入,本文给出了超圆环面的一种新的时间为常数步的路由算法.当d≥2,c≥8时,此路由算法得到的超圆环面任意两个结点间的路径长度≤D 1(D为超圆环面的直径)。 相似文献