首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域。本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中。高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教。首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作。  相似文献   

2.
通过研究聚类分析技术中的K-means算法,对其初始聚类中心的选择方法进行改进,并将改进后的K-means算法应用到高校师范生教学技能考核评价系统中,充分利用高等师范院校积累的教学技能考核数据,从而有效提高师范专业学生教学技能水平.  相似文献   

3.
研究学生状态分析系统,旨在收集学生的综合数据,并对这些数据进行分析给出学生的状态,为老师和学生提供一个交流平台.使用基于改进粒子群优化的K-means算法来分析学生的数据,可以提高K-means聚类算法的全局搜索能力,缓解粒子群优化算法的早熟收敛现象.与基于标准粒子群优化的k-means算法和基于遗传算法的k-means算法的收敛结果相比,本文研究的算法有更好的搜索能力.将系统得到的学生评估结果与人工评价得到的相比,从系统获得的评价更全面、更客观.系统还可以提供视觉信息.最重要的是系统还能帮助老师更好地了解学生,及时引导学生,提高管理学生的效率.  相似文献   

4.
【目的】针对标准协同训练中视图分割不充分冗余导致两个分类器误差累积加大,且两个分类器对同一个未标记样本分类不一致的问题,提出了结合信息增益率和K-means聚类的协同训练算法。【方法】该算法先根据有标记样本计算出数据中每一个特征的信息增益率,将信息增益率高的特征平均划分到两个视图,再在每次分类过程中应用K-means聚类确定标记不一致样本点的最终类别。【结果】通过在9个UCI数据集上的3组实验表明,与对比算法相比,所提算法中两视图分类器的平均正确率差值降低了2.9%,有效均衡了分类器性能,同时在分类准确率和算法稳定性上也有较大提升。【结论】利用信息增益率将关键特征均衡划分到两个视图,有效解决了视图分割不充分冗余问题;K-means聚类重新分类标记不一致的样本,降低了样本被误分类的概率。  相似文献   

5.
K-means算法是应用最广泛的聚类算法之一,但存在明显缺陷:对初始值敏感,还需给定类的数目.层次K-means算法提出将多次k取固定值的K-means运算所得到的中心点作为类的代表,并通过对这些中心点进行层次聚类来得到更好的初始聚类中心,然而在中心的融合过程中并没有有效利用类的几何信息.从类的几何特征入手,提出一种基于类的分位数半径的动态K-means算法(QRD K-means).此算法在层次K-means的基础上令每次K-means运算的k值变动起来,且又引入了分位数半径的概念,用样本点到类中心距离的分位数作为类的半径,将样本点间的关系简化为各个类的分位数半径与类中心的关系.通过中心点间距离与分位数半径大小的比较对中心点进行融合形成新类,从而快速给出良好的聚类结果,同时也确定了类的数目.在仿真实验中,通过与不同算法在时间和分类精确度上的比较分析,也证明该方法快速有效.  相似文献   

6.
多阶段聚类—朴素贝叶斯的异常检测   总被引:1,自引:0,他引:1       下载免费PDF全文
针对异常检测手段用来标定数据集中明显的不同于其他数据的对象,提出多阶段聚类旨在解决噪声数据的引入和缺失属性样本的处理,并改变传统的贝叶斯分类的被动学习为主动学习的方式来构造性能优越的分类器。在数据预处理阶段,利用密度聚类滤去噪声点,密度聚类的输出作为下一阶段的K-means聚类的输入,提高了K-means的分类准确率。K-means负责对缺失属性的样本进行处理。在分类阶段,利用adaboost学习算法优化朴素贝叶斯分类器,使其获得较好的分类效果。  相似文献   

7.
针对超星学习通课程学习过程中学生出现的被动学习、消极学习现象,提出分析学生学习态度的方法,构建学习态度跟踪模型.首先针对超星学习通平台收集的学生网络学习行为数据,选取与学习态度相关性较高的指标,形成训练数据集;然后,通过调查法对学生学习态度进行调查,以此获得学习态度标签;最后,基于分类算法构建学习态度跟踪模型,采用五折交叉验证方式进行实验.实验对比了不同分类算法的预测准确率,当采用Ada-Boost(Adaptive Boosting)算法作为学生态度积极性分类算法时,可较为精准地预测学生的学习态度.实验结果表明,构建的学习态度跟踪模型具备一定的学习态度分析能力.  相似文献   

8.
将K-means聚类算法在对事物分类中的优点用于判断变压器的故障中.并针对K-means聚类法在给定初始聚类中心不良的问题上进行改进.将改进的K-means聚类算法与三比值法相结合,以此来诊断变压器的多种常见故障.应用MATLAB分别对改进前后的K-means算法进行仿真,并将改进后的仿真结果同改进前K-means聚类算法的结果进行对比分析.结果表明,改进的K-means聚类算法不但能精确、有效地对变压器故障进行诊断,并且改进的K-means聚类法使仿真结果更加准确可靠.  相似文献   

9.
结合K-means的分类方法在电信客户流失中的应用   总被引:1,自引:0,他引:1  
通过对电信业客户流失预测的国内外研究成果的分析,我们发现造成电信业客户流失原因种类比较多、难以用一种通用的划分标准对流失客户的流失特征进行刻画,因此本文提出了将K-means算法与传统的分类算法相结合的方法进行客户流失分析,并进行了应用实验.该实验以中国联通湖南某地区X分公司的客户数据为基础,利用数据挖掘软件Clementine8.1建立了客户流失分类预测模型,模型的应用结果表明:新方法对客户流失预测的命中率高于传统的分类预测算法.  相似文献   

10.
针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means两种典型的聚类算法,提出一种新的聚类思路,使用Canopy先对用电数据进行粗略处理,得到聚类个数和聚类中心,再用K-means精确聚类,既利用了K-means算法简单、收敛速度快的优势,又使其不容易陷入局部最优.为达到处理海量数据的目的,把提出的算法部署到MapReduce框架上进行实验.研究结果表明:提出的算法在海量用电数据的处理方面高效可行,并且具有良好的加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号