首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
决策树C4.5算法在森林资源二类调查中的应用   总被引:3,自引:0,他引:3  
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景.  相似文献   

2.
随着农业数据规模日益增加,相应的、有针对性的数据挖掘平台设计成为迫切需要.该文设计了基于互联网+数据挖掘的农业数据平台,包括交互层、功能层、数据层3个层次.功能层是平台的核心,负责数据预处理、数据挖掘、挖掘结果展示等任务.针对Apriori算法进行了改进,通过频度集合、支持度集合、地址集合的联合使用,避免了重复扫描和频度冗余,进一步提升了挖掘算法的效率.以水稻生长中的二化螟虫害问题为研究对象,展开平台性能的验证性实验.实验结果表明:4种因素对二化螟爆发影响的强弱顺序为5月份降水最大,其次是5月份的温度,再次是2月份的温度,最后是2月份的降水.  相似文献   

3.
利用车辆传动系统试验数据对车辆进行故障诊断和性能评价可以实现车辆故障预警,提高可靠性,从而提高车辆性能,但测试数据有数据量大、不平衡、维度高、噪声多的特征,使得传统数据分析算法会产生次优的分类模型.针对上述问题,提出了一种改进的不平衡数据分类支持向量机算法.该算法赋予各样本不同的权值,用马氏距离改进模糊隶属度的设计以排除变量相关性干扰,同时可以输出正常状态下的故障概率.实验结果表明,该算法能够有效提高故障诊断的准确性,概率输出模型可用于故障预警和性能分析.   相似文献   

4.
分析了大数据环境下的O2O电商用户数据特征,提出O2O电商用户数据挖掘框架,并探讨数据挖掘流程和主要的数据挖掘方法,分别从O2O电商平台、O2O用户和O2O商家三者角度探讨了O2O电商用户数据挖掘的应用问题.研究认为:O2O用户数据挖掘框架包括数据来源层、数据收集层、数据组织层、数据分析层与数据应用层等层级;数据挖掘流程主要包括数据收集、数据预处理、数据挖掘及数据应用4个过程;O2O电商用户数据的挖掘应用包括精准营销、平台网站优化、欺诈分析与防范、个性化推荐、增值服务开发与产品创新等方面.  相似文献   

5.
为了提高火电厂大数据平台的生产维护安全化、监控管理精细化、经济效益持续化,提出了大数据平台内开发故障诊断预警系统,采用基于自适应力矩估计(adaptive moment estimation, Adam)算法优化二维卷积神经网络方法建模技术融入于大数据平台中,并结合大数据平台和专家故障预警诊断功能进行测试与应用。首先对故障预警模型进行数理建模及模型训练优化,直至满足模型功能要求,实施模型算法代码与大数据平台的合库部署上线、满足提前发现系统故障的功能,并结合机理分析对故障系统进行细致化分类,最终发现根本的故障原因。实现了火电厂生产过程中各系统运行特性的全周期监控,在系统或设备发生故障前进行预警并推送异常信息,规范化了模型部署在大数据平台后的测试与实施工作,进一步发现模型缺陷,提高模型准确率。  相似文献   

6.
在数据挖掘的过程中,由于贝叶斯分类算法要求条件属性必须独立,因此具有一定的局限性.考虑该缺陷,提出用数据挖掘中另一种常用聚类算法对原始数据的条件属性进行数据预处理后,再使用贝叶斯算法.实验表明该算法提高了分类的准确率.  相似文献   

7.
分析数据挖掘领域的聚类分析方法及代表算法,比较这些算法的性能,对数据挖掘中的谱系聚类进行举例说明.实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,可以快速和合理的解决粗糙集数据挖掘中数据预处理的问题.  相似文献   

8.
通过数据挖掘技术分析与飞机运行和维护相关的数据资源来研究一套能及时察觉、分类并预报故障的飞机实时监控系统(Aircraft Real-Time Monitoring & Troubleshooting System,AMTS),使其能够在优化飞机关键部件寿命的同时减少飞机运行和维护的费用.分析着手于历史维护经验库,结合飞机维护技术文档和相关数据挖掘算法,介绍了构建该系统的原理和方法,并初步实现利用飞机实时故障报文对飞行状态进行实时监控及故障诊断.  相似文献   

9.
对气象数据挖掘和ARIMA预测算法进行分析,构建了基于Hadoop的气象数据挖掘平台,并在该平台上设计实现了基于ARIMA算法的气象预测系统.实验结果表明,该气象预测系统具有易扩展性、易维护性和对海量气象数据的高效管理特性,实现了气象预测功能.  相似文献   

10.
在空气污染大数据预处理的基础上,提出了一个基于深度学习的空气污染物浓度预测平台.该平台架构分为数据采集层、模型层和可视化界面层3个层次,分别实现了数据采集与处理,基于长短期记忆(LSTM)网络模型的污染物浓度预测,以及预测结果可视化的功能,通过对用户个性化模型参数的设置,实现不同时间段污染物浓度时间序列的预测.  相似文献   

11.
通过分析多源海洋数据特点和海洋综合管理应用优势,研究并论述构建多源海洋数据综合管理应用平台的架构解决方案。该方案提出平台整体设计采用四层架构(数据资源层、数据服务层、服务逻辑层和应用表现层),并针对功能应用模块设计基于C/S和B/S的混合架构方案并进行实现研究,使该平台系统成为集海洋数据信息管理、分析、计算和应用为一体的综合海洋业务服务平台。  相似文献   

12.
面向服务的大数据分析平台解决方案   总被引:2,自引:0,他引:2  
本文针对日益增长的大数据分析与信息服务的应用需求,提出基于数据中心和互联网、面向服务的大数据分析平台解决方案,为开展大数据分析相关的研究和实践提供借鉴和参考。首先对国内外大数据技术的产业现状进行回顾,然后给出基于数据中心和互联网的大数据分析平台拓扑架构,讨论大数据分析平台的系统功能和关键技术,最后阐述该平台系统的应用和产业化前景。  相似文献   

13.
针对目前大多数中医药数据挖掘研究中使用单一且基础的算法而出现的问题,设计并实现一种通过策略模式智能优选中医药数据挖掘方法的平台(TCM data strategy model analysis platform, TCMDP)。根据策略模式的思想,集成以下4个数据挖掘模块,统计学分析模块可对药物、药物种类、四气五味归经和药物功效进行统计学分析;关联规则挖掘模块可以分析处方中的药物关联性;聚类分析模块可获取药物组合得出聚类新方,通过分析结果来探讨肺癌处方的配伍规律;证型分类模块以电子病历的中医症状和四诊信息作为输入,将相关证型作为输出,构建证型分类模型。综上实现了基于策略模式的中医药数据智能挖掘平台,并运用该平台对中医临床治疗肺癌的中药处方进行用药规律和证型分类研究。结果表明:以痰瘀互结证肺癌病例为例,关联规则挖掘模块中WD-Get Rule算法的运行时间最少仅为0.038 s。聚类分析模块中CMC-DD算法分析时间略长但精确率高达87%。肺癌证型分类分析模块中PSO-ELM运行时间短为88.98 s,且模型平均精确率达88.44%,具有一定的临床参考价值。而本平台所采用的改进算法均优于...  相似文献   

14.
本论述对低保数据的挖掘中,使用了两种挖掘算法,另外配合SQL Server 2010提供的数据挖掘功能对低保数据进行了全面的分析,介绍了OLAP技术和数据挖掘在低保数据分析中的应用.主要内容包括:分析了数据挖掘技术在低保数据分析中的应用意义;研究了关联规则、决策树算法、聚类分析在低保数据分析中的应用.这也是低保信息化工作今后重要的研究目标和发展方向.  相似文献   

15.
本论文主要设计一个粮库粮情监控系统,整个系统可以分为电源电路模块、温度传感器模块、单光束反射式红外光电传感器模块、数字显示模块、无线传输模块、控制芯片模块、报警模块与软件程序模块,并对各模块选用上进行了充分论证.基于该粮情监控系统,我们对其进行了系统测试与数据分析,并通过实验获得的数据论证了该粮库粮情监控系统的可靠性.  相似文献   

16.
基于SVM分类算法和Web服务框架,提出了一种医疗数据分析与疾病预测模型,改进了医疗数据分析系统与医院数据库之间的数据传输协议.采用该模型与长春某三级甲等医院合作,获取了总共1 695条病人电子病历数据与病人疾病信息作为实验数据,并在医疗数据分析系统中进行数据挖掘分析.通过数据条数的变化和对属性的控制来测试设计的数据分析模型和改进的数据传输协议的传输效率.实验表明,在传输数据之前对数据进行预处理并且通过特征选择算法进行降维处理有助于提高整个系统的医疗数据传输效率和预测准确度.  相似文献   

17.
随着大数据时代的到来,教育信息化发展迅猛.近年来以云计算、数据挖掘、移动互联网等为基础的大数据技术为教育研究提供了多方面支持.利用数据技术进行教育领域的研究,为教育教学决策提供有效支持正在成为教育的发展趋势.基于华中师范大学云课堂平台上的数据,通过社群分类算法,对学生学习行为进行分类研究.构建学习行为社交网络,通过PageRank算法寻找网络中的"核心人物",并结合SimRank算法实现分类.  相似文献   

18.
数据挖掘技术是从庞大数据中挖掘出隐藏信息的有效工具,它包括神经网络、数据库技术、信息检索、模式识别、图像与信号处理和空间数据分析等多门学科技术。该文主要对传统BP神经网络算法进行改进,并将改进后的算法应用于数据挖掘的技术上,且将仿真实验结果与传统算法的实验结果做了对比,结果显示改进后的算法可以提高数据的分类与识别。  相似文献   

19.
根据网络传输数据量大,实时性高的特点,提出一种基于聚类的触发式网络监控模型。该模型将系统划分为网络用户层、实时监控层、数据分析层、触发控制层、前端应用管理层等五个层次,将数据处理分为信息采集、数据初步分析、数据聚类、结论确定和响应阶段,依靠各模块实现各阶段的任务和功能。模型各部件分布式部署,可各自承担数据处理和传输存储任务,提高了整体运行效率。  相似文献   

20.
由于大数据具有其自身的独特性,即数据量大、多样性突出,所以在进行大数据分析时,在处理速度、效率和实时性等方面要求都非常高。而数据挖掘技术主要就是从大量数据中基于建模算法,寻找在数据中所隐藏的信息,以此促使大数据的价值得以充分发挥。Spark平台是一个针对超大数据集合的低延迟集群分布式计算系统,利用其进行大数据挖掘与分析更具优势。据此,本文主要对基于Spark平台的大数据挖掘技术进行了详细分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号