首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 25 毫秒
1.
为了对现实中的大规模数据集进行分类挖掘,提出了一个基于关联的自适应分类规则挖掘模型,研究了该模型在预处理、多层分类规则的挖掘、算法的可扩展性、效率和输入参数的自适应等方面的技术和方法.  相似文献   

2.
关联规则挖掘在农业产值分析中的应用   总被引:1,自引:0,他引:1  
简述了数据挖掘技术及其在农业中的应用.针对农业普查数据,分析了数据挖掘系统结构,并详细描述了农业数据的预处理.利用关联规则FP-Tree算法从农业产值的大量相关历史数据中挖掘农作物数据的各种属性与其农业产值之间的关联关系, 为农民及时有效的对农业生产做出规划和调整提供科学依据.  相似文献   

3.
指出了时序关联规则在支持度度量上的不足,存在处理高密度海量数据时往往要耗费大量的时间处理规模巨大的频繁候选集,同时需要多次重复扫描数据库,执行效率低等问题,提出了重新定义支持度度量方法的时序关联规则.针对时序关联规则在解决项分类时涉及到的分层不确定、不准确情形,引入了基于隶属度的模糊层次分类结构,定义了项间距离、项集间距离,最终得到一种新的关联规则间距离的度量方法.实现了模糊层次分类,将时序关联规则结果进行聚类分析,得到规则和规则之间相似性,实验验证了该方法的有效性.  相似文献   

4.
一种应用关联规则森林的改进贝叶斯分类算法   总被引:1,自引:0,他引:1  
针对朴素贝叶斯分类方法中属性值条件独立假设不适应实际情况的问题,提出了关联规则森林表示法及应用关联规则森林的改进贝叶斯分类算法(ABC算法).ABC算法利用关联规则挖掘得到满足条件的关联规则,并由此来构造关联规则森林,而规则森林中所有根节点的概率与所有适用的规则置信度连乘,就得到所有属性值的联合概率.应用UDI数据集对分类器进行了测试,分类结果表明,ABC算法的分类准确率明显高于朴素贝叶斯分类算法,平均提高5%,特别是对属性间有着较强依赖关系的数据集,其分类准确率提高了37%.  相似文献   

5.
传统预处理数据的方法没有很好利用数据之间的相互信息,所得到的预处理结果难免会出现失真、不能准确反映数据之间的更多信息,利用相关分析中的相关系数概念以及相关的思想和构造方程的方法,给出了一种相关分析方法及其体算法用于对娄据源中的缺损数据进行修补,并通过大量实例数据演算验证,该方法分利用已有数据给出的因素之间的数据表现,进行数据驱动来填补未知的数据,且可用于解决仅有当期数据,而无历史数据的数据预处理问题。  相似文献   

6.
如何对网上用户分类是W eb挖掘领域应用最多的任务之一,本文尝试将关联分类方法应用到W eb用户分类模式的挖掘.我们首先对服务器日志文件进行预处理,形成一个访问事务集;然后对该事务集进行数据挖掘,找出所有满足最小信任度和支持度的类别关联规则;最后,我们用这些类别关联规则去预测用户的兴趣.实验证明此方法是有效的.  相似文献   

7.
聚类思想在挖掘关联规则中的运用   总被引:2,自引:1,他引:1  
数据挖掘中的关联分析技术旨在发现大量数据项集之间有趣的关联关系.虽然Apriori算法利用剪枝方法有效地提高运算效率,但在处理超大型事务数据库时,仍会存在内存瓶颈问题.按照项集对数据库进行聚类预处理,然后在各个数据簇内进行关联分析以提高运算效率,且簇的数目可根据情况由数据挖掘者根据情况预先指定.通过对该算法的复杂度分析得出在一定条件下运算的时间复杂度确实有所下降的结论.  相似文献   

8.
针对红外抗干扰评估指标体系存在的冗余现象和缺乏合理性的特点,从红外导引头的固有属性、抗干扰性能指标以及导弹战技性能指标3个角度构建红外抗干扰综合评估指标,通过红外抗干扰实验仿真平台,设置相应干扰量,获取海量数据并对其进行预处理;再利用数据挖掘中的FP增长关联规则算法,对数据进行挖掘分析,得出干扰量与指标之间的关联规则;...  相似文献   

9.
基于模糊关联迭代分区的挖掘优化方法研究   总被引:2,自引:2,他引:0  
由于数据库存在数据量大、多维性的特点,传统挖掘方法在对数据进行处理时,无法构建精准的数学模型,容易出现部分信息丢失、分区过硬的问题。提出一种基于模糊关联迭代分区的挖掘优化方法,通过模糊C均值聚类算法对原始数据集进行预处理,过滤冗余数据,获取原始数据集的模糊分区;利用模糊关联挖掘算法获取感兴趣规则,实现数据的优化挖掘。实验结果表明,针对不同的数据集,改进的方法均具有很好的分区性能,且时间复杂性低,挖掘精度高。  相似文献   

10.
数据挖掘技术在问卷调查分析中的应用   总被引:1,自引:0,他引:1  
谭明杰 《科技资讯》2006,(26):182-183
问卷调查的分析方法在各个行业被广泛应用,本文介绍了利用数据挖掘技术中的分类挖掘和关联规则挖掘技术对问卷调查数据进行分析的方法,以得到深层次的分析结果。  相似文献   

11.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

12.
从一卡通用户消费记录中筛选出学生早饭就餐数据,使用数据规约、数据聚集、特征创建、离散化等预处理方式,抽取就餐次数、时间、时间标准差表征学生早餐特点。运用相关性分析和关联规则的方法对早餐习惯与成绩之间关系进行分析,发现以就餐次数和时间为主要特征的早餐习惯与成绩具有较强的相关性和可靠的关联规则。对教学管理部门而言,可以将分析结果应用到学习成绩预警过程性评价中,从而提高成绩预警的时效性。  相似文献   

13.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

14.
针对电子政务的特点,提出利用数据挖掘的关联规则算法对用户行为进行分析,通过挖掘行为路径之间的潜在关系,从在大量电子政务网站数据中发现有用的知识模式,该知识模式对于用户分析、知识分类、个性推荐等起到了很大的作用,提高了电子政务应用效率.  相似文献   

15.
数据挖掘在智能交通系统中的应用   总被引:2,自引:0,他引:2  
目的将数据挖掘技术应用于智能交通系统中,利用挖掘得到的模式对交通管理决策提供有效支持。方法针对交通数据库系统中数据的特点,提出了基于概化的数据预处理方法,并在此基础上,采用基于树模型的关联规则挖掘算法进行关联规则挖掘。结果获得了良好的挖掘模式。实际应用说明了挖掘结果的有效性及可行性。结论数据挖掘技术在智能交通系统中的成功应用,为交通管理决策提供了有效支持,且提出的方法易于实现,便于推广。  相似文献   

16.
缺损属性的补充方法——迭代MVC   总被引:1,自引:0,他引:1  
迭代MVC法是一种基于关联规则推导的缺损属性补充方法,通过RAR(Robust Association Rules)算法产生候选关联规则,使用补充关联规则选择策略和用户的交互选出补充关联规则,进行缺损属性的补充,减少补充属性的噪音引入,提高数据补充的正确度,增强数据挖掘的精确度。  相似文献   

17.
针对传统分类方法中飞机雷达回波信号识别分类精度低、人工定义特征稳定性差的问题,提出基于多重分形关联特征和深度卷积神经网络(convolutional neural network,简称CNN)的雷达目标分类方法.首先,对输入训练数据进行多重分形关联分析,将多重分形关联谱的投影图作为输入特征图;然后,利用深度卷积神经网络对特征进行训练,得到训练模型;最后,使用训练后的模型对目标进行分类.实验结果表明:相对于其他3种方法,该文方法有更强的飞机分类性能.  相似文献   

18.
生存时间之间的关联分析引起许多从事生物与医学领域研究者的兴趣.这种分析的目的是利用Coupla方法调查在蒙特卡罗适度审查背景下,双变量生存数据之间的关联.该文利用皮尔森关联系数去估计双变量失败数据之间的关联.研究结果表明:当审查百分比低时,基于Gubel的估计方法更为鲁棒,而且正关联越强,分别用审查百分比是0%和30%所估计的结果越精确.这对基于Frank,Gumbel和Clayton的估计方法是正确的,甚至在Copula假设条件下真实情形也成立.  相似文献   

19.
针对穿戴式跌倒检测中特征属性过多,传统的降维和PCA赋权降维方法仅考虑了单个特征的重要度,未将特征组合的重要性考虑在内的问题,提出一种改进的基于关联规则挖掘的赋权特征选择方法。在特征降维过程中引入关联规则挖掘,根据频繁项集的支持度和置信度为特征赋权,实现特征选择。利用真实的数据集进行对比实验,结果表明:该方法分类的正确率、特异度和灵敏度均高于未经降维的原始数据集和经PCA赋权选择的数据集。该方法不仅能够实现对高维数据的降维,而且考虑了特征间的关联规则,能够得到更为优质的特征向量数据集。  相似文献   

20.
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是一个不可缺少的数据预处理过程,因此提出了一个基于统计度量的缺失值填补算法,名为灰色类中心缺失值填补(GCCMVI)方法,利用数据点的类中心和标准差来填补缺失值,此外,通过比较阈值和实例与类中心间相关性的大小关系,决定是否加上(减去)标准差,灰色关联分析用来计算相关性,在缺失值被填补后,得到的完整的数据集用来训练支持向量机(SVM)分类器.在三种类型不同的数据集上进行比较,以分类精度,填补效果,填补时间作为评估准则来衡量算法的有效性.实验结果表明,所提出的算法显著地提高了分类精度和填补效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号