期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈永春王晓《哈尔滨师范大学自然科学学报》2012,(2):57-59,68

关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向. 相似文献

2.

基于权重的改进K-means算法应用研究

宗春梅郝耀军焦莉娟《高师理科学刊》2017,37(11)

数据聚类是将数据对象划分到不同的类或簇中,是数据挖掘中的一项重要技术.教育领域拥有海量的学生信息数据,把数据挖掘中的聚类技术引入其中,具有很强的实际价值.阐述了运用数据挖掘中改进的引入权重的聚类技术对成绩数据进行选择、预处理和挖掘分析等,展示了3个Matlab实验使成绩数据如何通过K-means算法进行聚类分析,并对3种运行结果的意义各自进行了显示与分析,同时指出了运行结果的不足及意义.针对学生实验中的分类原因进行了研究并在学生成绩分析中发现很多隐含着的不易发现的有价值信息,利用这些聚类结果提出了相应的教学措施及建议,从而有针对性地提高教学质量. 相似文献

3.

实际应用的需求对大数据挖掘的推动

《哈尔滨师范大学自然科学学报》2017,(1)

实际应用、大数据、挖掘算法和处理平台4个要素的紧密结合构成了大数据挖掘的核心.根据大数据的特征,分析相关案例,指出实际应用的真实需求才是大数据挖掘的目标.大数据挖掘的价值体现必须结合应用数据和与应用匹配的算法,在数据处理平台的支持下,将挖掘到的知识或模型去指导实践. 相似文献

4.

关联规则增量式更新算法的研究

何宏肖建华肖伟平《湘潭大学自然科学学报》2006,28(3):36-39

关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献

5.

基于粗集理论不完备数据的改进算法 总被引：1，自引：0，他引：1

刘伟《松辽学刊》2007,28(3):113-114,130

由于经典的粗糙集理论不能处理原始数据中的遗漏信息,需要对这些数据进行补齐才能用于知识获取.因此数据预处理在粗糙集理论应用中非常重要的一环,其结果将直接影响到粗糙集理论应用的效率、准确度.所以有关基于粗集理论的数据挖掘中数据预处理的方法研究具有非常重要的意义.本文分析了当前主要数据补齐算法的特点和不足,并针对已有的基于粗糙集理论的不完备系统补齐算法ROUSTIDA的缺陷,提出了改进的数据补齐算法,使更多的缺损数据得到填补,尽量避免可能导致的决策规则矛盾问题. 相似文献

6.

心脏病诊断系统中缺失数据填充方法

张宏烈慕钢党佳俊李诚刘佳星《高师理科学刊》2021,41(12):44-49

缺失值数据是目前研究数据分析的一个重要领域,随着智能医疗的迅速发展,如何充分利用海量数据挖掘出其中的重要信息,对隐藏的疾病做出预测并进行提早的干预治疗显得尤为重要.但在实际预测中,经常面对不完备数据集,从心脏病数据集出发,基于随机森林算法加以贝叶斯优化算法动态调参,提出心脏病缺失值补足算法.以准确率ACC作为算法的评判依据,通过精度和时间2个方面进行验证,4种算法对比实验结果表明,提出的算法具有更准确的填补效果. 相似文献

7.

基于随机森林的多阶段集成学习方法

徐慧丽《高师理科学刊》2018,(2)

集成学习主要分为串行和并行学习方法.并行学习的优势在于分类器的并行学习和融合,对分类问题通常采用的融合策略为投票法或堆叠学习法,它们的代表分别为随机森林和堆叠泛化Stacking.为了进一步提高Stacking的分类性能,在经典Stacking算法原理的基础上,提出基于随机森林的多阶段集成学习方法,以随机森林作为基层的基学习算法,以投票法和学习法同时作为融合方法,来降低泛化误差.在UCI数据集上的实验结果表明,提出的模型在Accuracy和1F指标上,相比Bagging,随机森林和Stacking等分类器在分类性能上有很大的提升. 相似文献

8.

基于神经网络模式的遗传算法在CRM的数据挖掘优化研究 总被引：1，自引：0，他引：1

冯锋徐琪《黑龙江大学自然科学学报》2010,27(6)

提出了一种有利于优化CRM的基于神经网络模式的遗传算法,在对该算法仿真研究的基础上,将其应用于CRM的数据挖掘中,用于优化BP神经网络模型的拓扑结构和连接权值,并给出了相关的遗传操作和实验结果。通过论证分析认为,该算法克服了原有几种用遗传算法优化CRM神经网络数据挖掘模型的缺点和不足,提高了数据的精度和准确性,具有广泛的应用价值。相似文献

9.

基于神经网络模型的聚类分析技术研究

李大辉王永红《高师理科学刊》2007,27(2):32-34

聚类分析已成为数据挖掘,模式识别等应用领域研究中非常活跃的研究课题.在聚类分析方法中,基于神经网络的算法,由于考虑到“噪声”或异常数据,可以自动确定聚类个数,可以产生鲁棒的聚类方法,而竞争学习神经网络、SOFM神经网络方法是其中有代表性的方法,对其进行了分析研究,并给出了引入可变速度的训练算法。相似文献

10.

大数据环境下利用随机森林算法和决策树的贫困生认定方法

王泽原赵丽胡俊《湘潭大学自然科学学报》2018,(6):115-120

针对当前校园扶贫工作普遍存在的“隐形贫困”及疑似“虚假贫困”等问题,提出了利用随机森林算法和决策树的贫困生认定方法首先,利用智慧校园大数据环境获取高校内学生的基本信息、消费信息等数据,找出10个具有分类能力的特征;然后使用基于permutation随机置换的残差均方减小量来衡量对于变量重要性评分;最后,基于随机森林算法和决策树进行判别与分类实验结果表明,提出的方法具有一定的准确性,相比Adaboost方法,无论是预测准确度还是平均绝对误差,随机森林方法都更出色 相似文献