首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 47 毫秒
1.
决策树算法是数据挖掘中重要的分类算法,本文首先阐述了数据挖掘中决策树的基本思想,然后针对ID3算法倾向于取值较多的属性的缺点。对ID3算法予以改进,并通过实验对改进前后的算法进行了比较,实验表明改进后的算法是有效的。  相似文献   

2.
利用数据挖掘中分类的技术,根据房地产客户的信息,对客户购买力、购买欲进行评估,根据客户是否会购买,将其分为两类:重点客户和一般客户.从损失成本和辨别能力方面考虑,构建了一个组合分类器模型.使用Weka软件,利用多个公司的客户历史数据,与决策树、神经网络、支持向量机以及贝叶斯网络的分类性能做了比较,发现该组合分类器在稳定性、正确率方面优于其他分类器.  相似文献   

3.
基于K-means聚类的快递企业客户细分方法   总被引:1,自引:0,他引:1  
为了实现对快递企业客户的科学划分,制定差异化的客户营销策略,建立了一种基于K-means聚类的客户细分模型。对快递企业呼叫中心的客户相关数据特征进行了分析与预处理,确定了合理的客户细分变量,并建立了基于呼叫中心数据挖掘的客户细分流程。以某快递企业为例对客户细分方法进行了验证。结果表明该方法能够有效区分快递客户为敏感客户、节俭客户、高端客户、潜在客户与优质客户等五类,为进一步营销方案的设计提供决策支持。  相似文献   

4.
介绍了金融时间序列分析及其方法,阐述了金融时间序列数据挖掘的特点,总结了金融时间序列数据挖掘的主要方法,介绍了金融时间序列数据挖掘的典型应用及技术进展.  相似文献   

5.
随着信息技术和互联网的发展,各种信息呈现爆炸性增长,且包含丰富的知识.从海量数据信息中挖掘得到有用的知识仍然是一个挑战性的课题.近几十年来,数据挖掘技术,作为从海量数据信息中挖掘有用信息的关键技术已经引起了广泛的兴趣和研究.但是由于数据规模的增长,以往的很多研究工作并不能有效地处理大规模数据,因此,开发设计或者扩展已有算法使之能处理大规模数据集,已经成为数据挖掘中非常重要的研究课题.近年来,基于云计算的数据挖掘技术研究已经成为一个热点话题,本文中我们研究开发一个基于大规模数据处理平台Hadoop的并行分布式数据挖掘工具平台PDMiner.在PDMiner中,开发实现了各种并行数据挖掘算法,比如数据预处理、关联规则分析以及分类、聚类等算法.实验结果表明,并行分布式数据挖掘工具平台PDMiner中实现的并行算法:1)能够处理大规模数据集,达到TB级别;2)具有很好的加速比性能;3)大大整合利用已有的计算资源,因为这些算法可以在由这些商用机器构建的并行平台上稳定运行,提高了计算资源的利用效率;4)可以有效地应用到实际海量数据挖掘中.此外,在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖掘任务.更重要的是,我们开放了灵活的接口方便用户开发集成新的并行数据挖掘算法.  相似文献   

6.
针对具有不确定性因素的作业车间调度问题,基于模糊数学的思想,把模糊加工时间、间隔期和模糊交货期用梯形模糊数表示,建立了基于客户满意度曲模糊作业车间调模型。运用Hopfleld神经网络算法求解,结合目标函数和JSP的全部约束条件,构建能量函教和JSP换位矩阵,保证了神经网络稳态输出为最优生产调度方案。最后用网络计划图对稳态输出的换位矩阵进行解码得到最优调度甘特图,避免了传统成本树法易出现死锁调度的问题。计算实例验证了本算法的可行性和有效性。  相似文献   

7.
压缩感知理论在数据获取、数据存储/传输、数据分析和处理方面有很大优势,成为近年来的研究热点.考虑到大多数图像信号信息分布有差异,编码端,在对图像分块的基础上,融合熵估计和边缘检测方法计算各图像块的信息含量,再从两个不同的角度进行分类采样:依据信息量多少将图像块分为平滑、过渡和纹理3类,使用不同的采样率采样;依据信息量的分布特征,采用不同的采样率分配策略进行采样.在解码端,根据不同类型的图像块构造不同的线性算子进行重构,再运用改进的迭代阈值算法去除块效应和噪声.实验证明,算法在提升图像重构质量的同时缩短了重构时间,并且对纹理边缘多的图像的重构效果较其他方法理想.  相似文献   

8.
文中以我国HJ-1卫星为主要遥感数据源,结合野外采样数据,采用决策树的监督分类方法,获取云南省西双版纳地区2011年的橡胶林分布状况,并在此基础上,以覆盖该区域的数字高程模型(DEM)和气象数据为基础,利用地理信息系统(GIS)空间分析方法,着重量化分析西双版纳地区橡胶林分布的气候特征和地形特征,得出西双版纳地区橡胶林的气候边界,界定橡胶林分布的海拔、坡度以及坡向范围.文中得到以下结论:利用环境一号卫星遥感数据能够获得精确的分类信息,表明环境一号卫星遥感影像能够作为获取植被环境信息的可靠数据源,实现重点植被生态问题的动态监测;橡胶林分布的高程上限是2100m,80%的橡胶林分布在高程范围为600-1300m的范围内,90%的橡胶林分布在坡度为0?到24?的范围内,橡胶林分布对坡向不敏感;橡胶林适宜分布在平均气温大于18?C,平均最高气温大于25?C,平均最低气温大于14?C的区域,这些区域的橡胶林分布比率较大.研究还定量分析了西双版纳橡胶林空间分布的地形和气候幅度,为橡胶林种植业的健康发展提供科学支撑.  相似文献   

9.
基于半导体光放大器的交叉增益型波长转换的新方案   总被引:2,自引:0,他引:2  
实验研究了基于单端耦合输入/输出的半导体光放大器实现交叉增益调制的全光波长转换,转换速率为2.5 Gbit/s,波长向上转换范围为12.8 nm,转换输出消光比大于15 dB.此种方案结构简单、更容易实现.理论研究结果表明,探测光获得的双程增益和光放大器后端面存在的透射损耗使得其转换性能优于普通交叉增益型波长转换方案.  相似文献   

10.
对现有的基于单元的算法进行改进,利用KNN算法思想得到距离与比例参数的合理先验值,以加快离群点检测的收敛速度;同时通过扩大单元粒度,减少了单元区域查询次数与算法的空间复杂度,从而在整体上提高了离群点的检测效率。通过实验,验证了改进后算法的可行性,同时比较了其与原算法在不同参数下的性能优劣。  相似文献   

11.
在历史故障数据基础上,分别掏建故障信息、装备信息、装备使用状况的数据集市,通过数据挖掘模型和可视化交互平台,形成基于可视化数据挖掘(Visual Data Mining,VDM)故障分析架构。以此架构为基础,探讨了故障数据仓库的建立以及故障数据挖掘算法,对实际故障数据进行预处理,并分析故障责任、故障趋势、故障分布等特性,得到图形化的分析结论,为装备的设计、制造、维护提供支持。  相似文献   

12.
集合枚举树是最大频繁项集挖据算法中常采用的数据结构。在此算法中,最大频繁项集的挖掘过程也可以看作对集合枚举树的搜索过程。为缩小对集合枚举树的搜索空间,本文提出了一种新颖而高效的剪枝方法:根据已挖掘得到的最大频繁模式动态排列枚举树节点的顺序,最大限度的施行剪枝,从而缩小搜索空间。该算法采用位图的数据格式与深度优先的搜索策略。实验结果表明,该算法能有效提高最大频繁项集的挖掘效率,在采用相同的测试数据情况下,效率优于FPMax。  相似文献   

13.
基于三维地质模型的露天矿模拟开采系统应用研究   总被引:1,自引:0,他引:1  
为了实现露天矿三维可视化模拟开采,提出了一种快速构建露天矿三维地质模型的方法——包络面构模法。在建立露天矿数字化三维地形/地质模型的基础上,根据露天矿的实际情况建立三维开采模板,自动生成推进模板,从而实现露天矿的模拟开采,使得多方案设计从中选优成为可能,进而提高了采矿设计的速度和质量。  相似文献   

14.
由于煤与瓦斯突出影响因素之间存在着复杂的非线性关系,为准确预测煤与瓦斯突出的危险性,本文提出了基于柔性神经树的煤与瓦斯突出预潮模型,其中利用多表达式编程和粒子群优化算法分别优化了自身的结构及相关参数,使得神经树具有强大的预测和分类能力,与传统神经网络相比具有更加灵活的自动优化能力.通过采用实测数据对算法进行了验证. 结果 表明与常规预测方法相比较,该模型的预测准确性高,具有良好的适应性和有效性.  相似文献   

15.
针对数据采集系统中单片机控制速度慢且数据传输速率受限的问题,构建了基于FPGA和PCI的高速数据采集系统。系统由信号处理单元、AD转换单元、FPGA单元和数据存储单元组成。FPGA既是控制器,控制FLASH并产生AD转换器所需要的逻辑,又是PCI目标设备,实现了与计算机的数据通讯。通过Quartus Ⅱ功能和时序仿真,满足了数据采集的高速性和数据传输的高效性。  相似文献   

16.
利用采煤引起的开采沉陷研究理论和概率积分法,以及ADINA三维模型的建立,结合已有采空区沉陷理论及经验公式和数值模拟对其进行综合分析,并选取合理的计算参数和建立基本数学模型.结果表明,概率积分法和数值模拟的综合分析能够比较准确预计煤层采动覆岩的剩余变形量,对于未来进行灾害的预测和采空塌陷区上高速公路的建设具有重要的意义.  相似文献   

17.
近年来,基于主题建模技术的代码理解方法成为研究热点之一.该类方法期望利用主题建模技术从软件代码中挖掘功能性主题,进而利用功能性主题帮助开发人员理解软件功能及其代码实现.然而,从代码挖掘出的主题中,功能性主题与其他类型主题(如横切性主题)混杂在一起,需要人工识别功能性主题;由于现有工作大多仅提供主题关联的词等基本信息,导致识别及应用功能性主题的过程费时费力.针对以上问题,本文提出了一种基于主题建模和静态分析技术的软件代码功能性主题获取方法.该方法在利用一组启发式过滤规则对代码进行预处理的基础上,基于主题建模技术从代码中挖掘原始主题;进而,基于代码静态分析获得的代码间结构关系,提出了一种名为主题内聚度的技术从原始主题中自动识别功能性主题;最后,定位主题关联的代码片段,并利用代码及其注释为主题生成自然语言描述文本,进一步帮助开发人员理解主题所体现的软件功能及其代码实现细节.本文基于一组开源软件代码进行了方法评估,评估结果表明本文方法能够有效获取功能性主题及其关联信息,进而帮助开发人员更好地理解软件功能及其代码实现.  相似文献   

18.
为了解决数据挖掘本身的局限性,提出了适用于制造企业的基础数据的改进K-means算法。该算法应用AHP方法将原始数据根据其特征属性进行加权预处理,可以将基础数据进行更精确的细分,完善了基础数据的准备,为企业提供了更加直观科学的决策依据。并通过实例验证了该方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号