首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
数据分类技术在高校人才识别系统中的应用   总被引:1,自引:1,他引:0  
提出将数据挖掘技术应用于高校人才识别中,采用数据分类方法对人才进行定量的识别,更具科学性.讨论了数据分类的定义和方法,介绍了决策树分类和简单贝叶斯分类以及贝叶斯网络推理的算法,并给出具体的数据分类实例,利用过去已有的引进人才的经验数据分析提取规则.为以后的人才识别提供合理的、科学的技术支持.  相似文献   

2.
数据挖掘技术从产生以来得到了广泛的研究和应用,在数据的分类技术方面C4.5算法的研究已经比较成熟,但在学生成绩挖掘方面的应用比较少,本文首先论述了主要分类技术,详细介绍了C4.5决策树分类算法,并以实际学生成绩数据为依据,进行学生成绩的数据挖掘,通过对挖掘结果的分析表明,C4.5决策树算法高效、准确,是对学生成绩数据挖掘的首选工具.  相似文献   

3.
数据分类是数据挖掘的主要内容之一,通过分析训练数据样本,产生关于类别的精确描述.贝叶斯分类是数据挖掘领域中一种常用的有效分类方法.在关系学习中,贝叶斯分类算法有很多种,对这些算法进行总结、比较,指出其优点与不足,对提高分类效率有很大帮助.本文对已有的关系学习中贝叶斯分类算法作了详细的比较,并进行归纳总结.在单关系学习中重点介绍了几种基于粗糙集的贝叶斯分类器和加权贝叶斯分类算法,并分析了各种方法的模型、权值确定方法、优缺点及进一步工作方向.在多关系学习中主要比较了几种基于语义关系图的贝叶斯分类算法,重点介绍了MI-MRNBC模型.最后对本文工作进行了总结与展望,提出进一步工作方向是研究基于粗糙集的多关系贝叶斯分类算法.  相似文献   

4.
研究数据预处理新技术,采用数据挖掘技术建立西部地区经济增长差异分析模型,在数据挖掘技术中采用决策树算法进行分析,克服现有算法的缺点,对现有算法进行改进优化,提高模型精度,得到省份分类情况及影响地区差距的主要相关要素.研究结果表明:相比于传统算法,数据挖掘技术更能找到数据间的内在规律,反映了数据挖掘寻找潜在数据规律的价值所在.  相似文献   

5.
随着数据挖掘技术在现实问题中的广泛应用,多标签学习现已成为数据挖掘技术中的一个研究热点.组合分类器链(ECC)算法是一种性能较好的多标签分类方法,其分类效果好、准确度高,但该算法的时空复杂度较高,不能适应大规模多标签数据分类任务.为此提出了一种基于Spark的组合分类器链多标签分类方法,将串行组合分类器链算法的各步骤进行了并行化实现.通过单机实验和集群并行化实验,证明该方法对大规模多标签数据集具有良好的适应能力和加速比,且分类效果不输于传统的串行多标签分类方法.  相似文献   

6.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

7.
决策树分类算法及其应用   总被引:2,自引:0,他引:2  
分类算法是数据挖掘中的最重要的技术之一.本文对决策树数据挖掘方法进行分析和比较;并应用分类方法挖掘枣树嫁接成活率与各种外在因素之间的关系,证明了决策树算法在果树研究领域有着广阔的应用前景.  相似文献   

8.
随着大数据时代的到来,教育信息化发展迅猛.近年来以云计算、数据挖掘、移动互联网等为基础的大数据技术为教育研究提供了多方面支持.利用数据技术进行教育领域的研究,为教育教学决策提供有效支持正在成为教育的发展趋势.基于华中师范大学云课堂平台上的数据,通过社群分类算法,对学生学习行为进行分类研究.构建学习行为社交网络,通过PageRank算法寻找网络中的"核心人物",并结合SimRank算法实现分类.  相似文献   

9.
分类算法是DM(数据挖掘)中的最重要的技术之一。本对具有代表性的分类算法进行了分析和比较;并应用分类方法在居民出行数据中挖掘出一些公交乘客规则,讨论了数据挖掘方法在公交乘客预测中应用的前景和实效。  相似文献   

10.
针对商业库存数据库中存在大量冗余特征和噪声,许多数据挖掘算法对于目标数据的维度非常敏感,随着数据特征的增加,算法的时间空间开销也急剧增加.商业库存决策支持数据挖掘算法利用粗糙集技术对数据作预处理,分析过滤这些冗余的例子,减少了噪声的干扰,减少了训练数据,运用粗糙集的分类算法和浮动搜索算法对浮动搜索算法进行了改进.并用此算法进行了仿真实现,验证了改进后算法的优越性.  相似文献   

11.
有效地进行频繁项挖掘一直以来都是数据挖掘任务中最为重要的组成部分。已有的大部分频繁项挖掘算法在数据项多及支持度低的情况下,算法的效率急剧下降。为了有效地解决此类问题,提出了一种采用双向十字链表结构的频繁项挖掘算法(two-way crossed list for frequent itemsets mining,TCLFI)。极大地降低了搜索空间,加快了频繁项的筛选过程,减少了所需保存的数据项个数,从而降低了时间复杂度,提高了频繁项的挖掘效率。实验通过真实数据集和合成数据集验证了算法的有效性和扩展性。  相似文献   

12.
广义异步并行多分裂块松弛迭代算法   总被引:1,自引:0,他引:1  
给出了求解大型线性代数方程组的适用于MIMD系统的异步并行多分裂块松弛迭代算法的一般模型,并在系数矩阵为块H-矩阵的条件下建立了该算法模型的收敛性理论.  相似文献   

13.
针对现有的快速方差分析算法进行并行可扩展性改进,设计一种高效的并行计算模型,并提出一种基于MapReduce模型的基因-基因相互作用识别算法MR-ANOVA算法.该算法有效解决了现有基因-基因相互作用识别算法在海量数据规模下普遍存在计算复杂度过高的问题.实验结果表明,该算法充分利用了云平台的并行计算能力,随着数据量的增大,加速比逐渐接近于集群数量,可高效准确地完成基因-基因相互作用的识别.  相似文献   

14.
数据挖掘在各行业发挥着越来越重要的作用,随着数据挖掘中数据量的高速增长以及大规模计算在数据挖掘中的应用,挖掘算法处理海量数据的能力问题日益突出。研究并行算法是解决这一问题的有效途径,该文对常见的数据挖掘关联规则及聚类并行算法进行了研究探讨。  相似文献   

15.
【目的】对现有的下一代测序(Next Generation Sequencing,NGS)纠错算法和工具进行分析,提出基于Hadoop平台的纠错算法,以解决大数据处理中计算机内存不足和运行时间长的问题,提升纠错性能。【方法】使用特定的数据对现有的基于K-spectrum的纠错算法进行测试,对各纠错工具的运行时间、内存峰值和纠错结果进行比较来衡量纠错工具的性能。在此基础上提出Hadoop分布式并行纠错算法(Parallel algorithm),并与串行程序、Lighter和Racer进行比较,分析分布式并行实现的可行性。【结果】现有的基于Kspectrum的纠错工具普遍存在较大的内存消耗现象,其中Racer和Sga的纠错效果较好。而Hadoop分布式并行纠错算法对计算机单机内存的消耗较低,当数据量超过一定值时,并行分布式程序的运算时间比串行单机程序明显减少。【结论】本研究提出的Hadoop分布式并行纠错算法不仅降低了内存消耗,而且提高了运算性能,更有利于大规模基因数据的分析处理。  相似文献   

16.
基于PCI总线技术,采用大规模可编程逻辑器件和高速存储器件,完成了双通道遥感卫星数据采集与回放系统设计,并分别进行了实际的遥感卫星数据实时采集测试和由模拟源产生遥感卫星数据的采集测试。测试结果表明,该系统可以接收大多数的遥感卫星下行数据,最高输入速率达640 Mbit/s,有效地解决了遥感卫星地面记录系统数据采集和系统调试与开发的数据源问题。与现有记录系统相比,该系统具有结构简单、造价较低的优点,同时其卫星模拟源的功能也弥补了现有记录系统的不足。  相似文献   

17.
一机两流的连铸生产计划模型与算法   总被引:3,自引:0,他引:3  
编制高效的连铸生产计划是现代钢铁企业提高生产率和降低能耗的有效手段,在此基础上,讨论了某大型钢铁企业一机两流的连铸生产计划编制问题,建立了基于目标规划的数学模型,目标是在满足生产规程的同时取得最大的效益·为解决该问题,提出了一种将遗传算法和禁忌搜索算法进行结合的智能搜索算法以加强遗传算法局部搜索能力·同时,在遗传算法中采用动态变异概率以防止出现早熟现象,在禁忌算法中采用自适应惩罚系数调整策略来满足模型中的约束,实际的计算结果证实了模型的可行性和算法的有效性  相似文献   

18.
Skyline group, also named as combinational skyline or group-based skyline, has attracted more attention recently. The concept of skyline groups is proposed to address the problem in the inadequacy of the traditional skyline to answer queries that need to analyze not only individual points but also groups of points. Skyline group algorithms aim at finding groups of points that are not dominated by any other same-size groups. Although two types of dominance relationship exist between the groups defined in existing works, they have not been compared systematically under the same experimental framework. Thus, practitioners face difficulty in selecting an appropriate definition. Furthermore, the experimental evaluation in most existing works features a weakness,that is, studies only experimented on small data sets or large data sets with small dimensions. For comprehensive comparisons of the two types of definition and existing algorithms, we evaluate each algorithm in terms of time and space on various synthetic and real data sets. We reveal the characteristics of existing algorithms and provide guidelines on selecting algorithms for different situations.  相似文献   

19.
用遗传算法解大规模病态线性方程组   总被引:2,自引:0,他引:2  
大规模病态线性方程组的求解是相当困难的。本文尝试使用遗传算法求解大规模病态线性方程组,采用了改善方程组病态程度的预处理及多种杂交手段相结合改善遗传算法搜索性能两项措施,结果表明遗传算法求解大规模病态方程组是可行有效的。  相似文献   

20.
本文在调查研究的基础上,根据大型成套设备项目管理的总体目标,系统地分析了目前存在的问题,运用德尔菲法和解释结构模型法建立了大型成套设备项目的目标及影响因素的多级递阶结构模型,并结合我国大型成套设备项目管理的现状与问题,提出了相应的对策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号