首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 25 毫秒
1.
针对数据提取方法无法进行海量挖掘,且挖掘结果不准确,挖掘时间较长的问题,提出一种基于数据挖掘算法的地域性强关联规则数据提取方法。结合地域性强关联规则数据管理系统,采集用户需求信息,检索特征关联性,收集地域特征。利用数据关联度,分析地域检索中地域特征间的关联,计算相似标签信息参数,并对支持度和置信度实施计算,从地域性强关联规则数据库中挖掘关联规则。利用Kulczynski量度和不平衡率实施相关性分析和过滤,最终获取到具有实际意义的强关联规则。实验结果表明,该方法挖掘效率较高,且具有广泛的应用价值。  相似文献   

2.
对互联网拓扑结构局部特性展开研究,针对已有IP定位数据库的异构性和准确率不高造成的特征度量分析存在偏差的问题,提出了一种基于机器学习的修正算法(IPMG).以复杂网络为基础,结合网络测量数据和已有IP定位数据库中的IP地理位置信息,定义了互联网局部拓扑结构的地理度和地理介数这两种新的特征度量;分析了地理度和地理介数分布的幂律特性以及二者与IP地理位置之间的关系;运用机器学习的方法修正了不同IP定位数据库之间存在的分析有偏差的问题,并通过交叉验证和地标验证结合的方法验证了IPMG算法的有效性.实验结果表明:IPMG算法有效修正地理度和地理介数的同时提高了IP定位数据库的准确率.  相似文献   

3.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

4.
为了降低小样本数据库欺骗率,提升小样本数据库的攻击防御效果,设计了一种基于潜在数据挖掘的小样本数据库对抗攻击的防御算法(潜在数据挖掘的防御算法).采用改进的Apriori算法,通过频繁属性值集的工作过程获取准确的强关联规则优势,并从小样本数据库中挖掘潜在数据对抗攻击,同时优化候选集寻找频繁集的过程,然后利用关联分析检测对抗攻击,并通过可信度调度控制访问速率来防止产生恶意会话,实现小样本数据库对抗攻击防御.实验结果表明,潜在数据挖掘的防御算法可有效防御小样本数据库遭受的多种类型攻击,降低攻击产生的数据库欺骗率,保障小样本数据库服务器利用率的稳定性.  相似文献   

5.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

6.
基于数据库约简的关联规则挖掘算法   总被引:7,自引:0,他引:7  
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中.  相似文献   

7.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

8.
基于数据挖掘的网络业务流分析方法   总被引:1,自引:0,他引:1  
为了从业务角度对网络的性能进行评价和优化,提出了一种新的网络业务分析方法——具有时态路径约束的关联规则挖掘分析方法.该方法以网络业务为分析粒度,以与网络业务流相关的时态属性和路径属性为约束条件,对已经积累的反映网络状况的海量历史数据进行挖掘分析.在进行关联规则挖掘时,利用频繁数据项集的性质,通过引入事务标号,在求出候选频繁项集的同时也求出其支持度,避免了为求支持度而进行的扫描数据库运算,极大提高了挖掘的效率和速度.实验结果表明,进行挖掘分析的数据量越大,该方法的性能和效率就越好.  相似文献   

9.
基于频繁集的多层次交互式关联规则挖掘   总被引:2,自引:0,他引:2  
定义了一系列关联规则的相关概念 ,然后 ,针对现有的销售事务数据库 ,提出了一种改进的获取多层次信息方法 ,并据此对各数据进行压缩编码 ,减少处理时间 .同时 ,借助频繁集和交互式技术 ,实现多个概念层次交互式挖掘 ,以按用户实际需要提取出其感兴趣的关联规则 ,从而提高了挖掘速度和运行效率  相似文献   

10.
针对“挖掘不同支持度下的关联规则需要反复扫描多维数据库所带来大量的系统I/O开销”这一缺限,提出一种基于中间存储的联机分析关联规则挖掘OLAM方法.在自行开发的联机分析处理OLAP的基础上,对待分析的多维数据集利用BCTree存储谓词集频度索引数,利用改进的Apriori关联规则挖掘算法分析用户感兴趣的维度,减少挖掘维度的个数,提高了反复挖掘的系统效率和系统针对性.生产数据证明了该方案的正确性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号