首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
通过对大量的心理学测试量表数据集进行分析和挖掘,从大量测量属性中提取了高效属性子集构建关键决策向量,建立了更具针对性和方向性的心理测评模型.该模型能够更加快速、准确地对大学生心理健康状况进行判断和预测,帮助校方对存在问题的受访者及时实施干预,避免问题恶化.  相似文献   

2.
基于粗糙集和证据理论的决策规则提取   总被引:2,自引:1,他引:1  
提出一种基于粗糙集和证据理论的两阶段决策规则提取算法, 该算法首先利用粗糙集中属性缩减的思想, 找出每条规则中的重要条件属性集合, 然后再基于证据理论中证据结合的思想进一步去掉重要条件属性集中的冗余条件属性, 从而得到最终的决策规则. 所给算法简化了属性集的约简, 对高维数据也是可行的. 实验结果表明, 利用该算法能够挖掘出高质量的决策规则.  相似文献   

3.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

4.
结合网络犯罪案件的数据描述特点,指出了利用关联分析技术对该类案件实现电子数据经验继承的可行性,并提出基于约简决策表的关联挖掘分析策略。首先阐述了针对案例库导出的关联决策表进行属性约简的必要性,其次根据公安行业特点,论证了在构造频繁项目集Hasse图基础上进行无冗余关联规则提取的实现过程,最后以网络诈骗案件与涉网敲诈勒索案件为例,进行关联规则挖掘的应用实例验证,所获关联规则集表明挖掘结果符合实际,有利于辅助侦查并明确防控策略。  相似文献   

5.
基于Rough集的数据挖掘在教学评价中的应用   总被引:2,自引:0,他引:2  
基于粗集的数据挖掘的主要过程是数据预处理、约简及规则提取.为了分析教师教学行为和教学效果之间的关系,以教学评价的数据为基础,利用基于粗糙集的数据挖掘技术进行挖掘.实例研究中采用基于分明矩阵的属性约简算法和启发式属性值约简算法,去掉决策表中的冗余属性和属性值,得到了影响教学效果的关键因素刎和相关规则.  相似文献   

6.
日志是计算机取证,入侵检测分析的重要数据来源,运用关联规则挖掘算法对日志进行分析是获取日志中所蕴含有用信息的重要方法.针对基于置信度一支持度框架的常用关联规则挖掘算法在日志分析中存在的不足,引入日志关键属性的概念,提出了基于关键属性约束的关联规则挖掘算法.实验结果表明,该算法能有效阻止无趣规则的产生,提高挖掘结果的有效性.  相似文献   

7.
基于共同进化计算的分类规则算法   总被引:1,自引:1,他引:0  
为提高分类挖掘的准确度,在分析ID3,C4.5和进化算法(EC)的基础上,设计了两个共同进化的种群分别表示选择的属性子集和分类规则子集,提出基于共同进化计算的分类规则算法(CRCEC),并构建CRCEC算法的适应度评价函数.用4个加利福尼亚大学Irvine分校的数据集对CRCEC,ID3,C4.5和EC算法进行测试比较,结果表明CRCEC算法分类准确度高,可以得到简洁的、可理解性强的规则.最后给出了CRCEC算法在公路车辆征费分类预测系统中的一个应用实例.  相似文献   

8.
基于粗糙集理论的股市预测研究   总被引:1,自引:0,他引:1  
提出一种基于粗糙集理论的股市预测方法.首先选择"收盘价"、"成交量"、"日均线"等指标作为条件属性与决策属性;而后采用RS理论,选择不同的条件属性子集进行约简和属性重要度排序,并由此提取出股市的预测规则.结果表明,该方法不需要任何前提假设,而且可以根据不同的参考指标,形成不同的预测规则集.  相似文献   

9.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

10.
分析稀少数据的相关性是一种重要的、有价值的数据挖掘任务。运用面向关联规则的FP树构造方法,提出了一种特异关联规则挖掘算法RSFPA。该算法将包含特异模式的数据集压缩成一棵FP树,通过挖掘FP树来提取特异模式集,从而进一步提高了特异模式的挖掘效率。最后,利用恒星光谱作为数据集,实验验证了RSFPA算法的正确性和有效性。  相似文献   

11.
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高.  相似文献   

12.
基于规则的推荐技术在数据集上挖掘项目关联和用户关联为当前用户做推荐.用户关联挖掘是使用用户关联进行推荐的关键.首先证明在整个数据集上挖掘到的关于当前用户的用户关联集是只在包含当前用户评价的数据集上挖掘到的关于当前用户的用户关联集的子集,提出基于两阶段计数的用户关联挖掘框架,然后应用概念格技术实现了基于两阶段计数的用户关联挖掘算法,并通过实验表明该算法具有更好的性能.  相似文献   

13.
关联规则技术在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘技术的诞生,使我们能从大量的数据中提取对决策者有用的信息,20世纪90年代初,R.Agrawal等提出了关联规则挖掘技术.关联规则挖掘是为了发现大量数据中项目集之间感兴趣的相关性信息.经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法.文中系统描述了关联规则挖掘所涉及的概念、关联规则挖掘算法和关联规则应用领域等.  相似文献   

14.
针对穿戴式跌倒检测中特征属性过多,传统的降维和PCA赋权降维方法仅考虑了单个特征的重要度,未将特征组合的重要性考虑在内的问题,提出一种改进的基于关联规则挖掘的赋权特征选择方法。在特征降维过程中引入关联规则挖掘,根据频繁项集的支持度和置信度为特征赋权,实现特征选择。利用真实的数据集进行对比实验,结果表明:该方法分类的正确率、特异度和灵敏度均高于未经降维的原始数据集和经PCA赋权选择的数据集。该方法不仅能够实现对高维数据的降维,而且考虑了特征间的关联规则,能够得到更为优质的特征向量数据集。  相似文献   

15.
针对基于形式概念分析的关联规则提取侧重属性之间的正关联、忽略负关联的问题,提出一种基于三支概念分析的关联规则提取算法(3ARM)。利用对象导出三支概念的内涵包括表达"共同具有"语义的正属性子集和表达"共同不具有"语义的负属性子集的特点,结合三支概念格的泛化与例化结构,高效地提取正负关联规则;基于三支概念的闭项集特性,从三支概念格中选出包含频繁项集的候选概念进行挖掘,减少不必要的搜索;通过对三支概念之间的关系进行研究,从父子概念中提取无冗余的正关联规则和负关联规则,再从兄弟概念中提取正负规则对规则集进行补充,充分挖掘三支概念格中的知识。MovieLens数据集上的实验结果表明:应用3ARM算法,在最小支持度为10%时,得到正规则86 027条,负规则93 685条;3ARM算法得出的正规则数量比FARM算法的多出0.9倍~1.5倍,减少了FISM算法最多28.3%的冗余负规则,分别减少了FISM和FARM算法44%~63%和27%~62%的运行时间。  相似文献   

16.
针对多维数据集的关联规则挖掘,提出了一种基于反区分矩阵的方法.首先由数据集同步得出区分矩阵和反区分矩阵,然后根据区分矩阵进行属性约简,再根据反区分矩阵找出约简后的频繁项集,最后给出关联规则.通过区分矩阵和反区分矩阵将属性约简和关联规则挖掘联系起来,减少了计算步骤,且算法只需扫描数据集一次,避免了繁琐的连接操作.应用实例表明该算法是一种合理有效的关联规则挖掘方法.  相似文献   

17.
一种基于可信度最优的数量关联规则挖掘算法   总被引:2,自引:0,他引:2  
研究了数量关联规划挖掘过程中的连续属性离散化问题,描述了连续属性离散化方程,包括连续属性区间划分算法和数据库样本大小的确定,提出了基于可信度最优的数量关联规则挖掘算法。该算法首先利用等深度划分算法对连续属性进行离散化,然后利用凸包处理技术提取强规则中可信度最高的数量关联区间,它对于数量关联规则的优化有着重要的应用价值。应用该算法对股票行情进行了数量关联分析,提取股票涨跌与股票价格之间可信度最高的关联规则。实验表明该算法是非常有效的。  相似文献   

18.
麦宏元 《广西科学》2013,20(4):341-344
建立数据缺失情况下的学生能力测评系统,并在新的属性集覆盖率和属性重要性等概念的基础上,提出该测评系统的属性约简和规则提取方法,最后用实例验证方法的有效性.  相似文献   

19.
分析现有等价矩阵规则提取算法对于大数据集低效性的根源,提出了一种新的等价矩阵以及根据决策类数目分割大数据集的方法,将条件属性和决策属性等价矩阵合并为一个矩阵,称为联合决策矩阵,该矩阵大大降低了等价矩阵的规模;提出了将大数据集转化为在多个子系统上串行进位链计算流程的规则提取快速矩阵算法,充分体现了人工智能领域中分而治之的思想.理论分析表明该算法在效率上较现有算法有显著提高;相应的对比实验结果表明,这种分治策略的矩阵分块和串行进位链法对大数据集上的规则提取的实用性和高效性.  相似文献   

20.
分析了概念格与关联规则之间的关系,提出了将频繁项集及其支持度存储在概念格上,然后在创建好的概念格上提取关联规则的方法,概念格的每个节点本质上是一个最大项目集,非常有利于关联规则的提取。然而目前对于概念格的研究,一般都假定由属性集所组成的概念格的内涵同等重要,而在现实数据库中,组成内涵的属性重要性往往是不同的,因此,内涵并非同等重要。为了充分利用概念格实现关联规则提取,提出了一种新的概念格结构:加权概念格,并给出其渐进式构造算法及基于该格结构上的关联规则提取算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号