首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
一种基于数理统计数据挖掘方法的研究   总被引:2,自引:0,他引:2  
分析了数理统计方法在数据挖掘中的作用,提出了一种基于数理统计的数据挖掘模型,并用实例证明该数据挖掘模型的有效性。  相似文献   

2.
基于数据挖掘技术的算法研究   总被引:2,自引:0,他引:2  
分析了贝叶斯信念网络和数理统计方法在数据挖掘中的作用,提出了一种贝叶斯信念网络和基于数理统计的数据挖掘模型,并用实例证明该数据挖掘模型有效性.对传统的贝叶斯信念网络构造算法做了许多改进,在不影响其性能的基础上,极大地提高了运算速度.  相似文献   

3.
蒙特卡洛法应用于房地产开发项目可行性研究   总被引:2,自引:0,他引:2  
房地产业是一个高风险、高利润的行业,因此房地产开发项目可行性研究中风险评价显得十分重要.采用蒙特卡洛法(MC方法)对房地产项目进行风险评价,可为项目决策提供科学依据。  相似文献   

4.
李娜 《科技信息》2008,(35):73-73
随着海量数据搜集技术提高、数据挖掘算法的不断完善、多处理器计算机技术的不断发展,成为支持数据挖掘技术发展的基础,数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对历史数据进行查询和遍历,并且可以找出历史数据之间的游在联系,从而促进信息的传递。  相似文献   

5.
本文介绍了数据挖掘技术产生的背景,数据挖掘的定义及主要功能类别,并分析数据挖掘技术的应用、存在的问题和前景展望。  相似文献   

6.
结合雅可比行列式和热力学变量的特性,率先导出了三个极为重要的雅可比热力学变换式,除(12)式外,其余尚未见报道。雅可比热力学变换的重要意义不仅体现在它为我们提供了一种证明难题的便利工具,而且还体现了在其揭示了热力学变量间的内在联系,或预告某热力学量随其它热力学量变化的情况,显然此用微分法往往难以实现。  相似文献   

7.
结合雅可比行列式和热力学变量的特性 ,率先导出了三个极为重要的雅可比热力学变换式 ,除 (12 )式外 ,其余尚未见报道 .雅可比热力学变换的重要意义不仅体现在它为我们提供了一种证明难题的便利工具 ,而且还体现在其揭示了热力学变量间的内在联系 ,或预告某热力学量随其它热力学量变化的情况 ,显然此用微分法往往难以实现  相似文献   

8.
在信息爆炸的网络时代,处理海量信息时会显得力不从心,而数据挖掘的出现与发展很好地解决了这一难题.本文介绍了数据挖掘技术及数据挖掘技术在电子商务中的应用,加深了对客户行为的了解,而且有利于更好地调整站点的结构.  相似文献   

9.
随着数据库和计算机网络的广泛应用,数据自动生成和采集工具的使用,人们拥有的数据量急剧增大。数据挖掘作为一项从海量数据中提取知识的信息技术引起了业界的广泛关注。本文阐述了数据挖掘的基本概念、数据挖掘的主要过程、数据挖掘常用技术以及数据挖掘工具。  相似文献   

10.
数据挖掘与人工智能技术   总被引:1,自引:3,他引:1  
数据挖掘是人工智能中的一个重要分支。对人工智能的发展及其最基本的技术:知识表示、知识推理、搜索,以及数据挖掘进行了详细介绍。通过实例给出了数据挖掘的定义,最后论述了数据挖掘与人工智能的联系,并结合国内外在该领域的研究成果指出了其广阔的发展前景。  相似文献   

11.
 在对澜沧江流域多年气象数据分析研究的基础上,依据气象数据的时序特性,结合数据挖掘中比例规则挖掘技术,实现了一个基于时序数据挖掘的气象预报系统.该系统对澜沧江流域近40年气象数据进行预测实验,结果表明:基于数据挖掘的气象预报系统的研究是对气象预报新路的有益探索.此外,该系统还提供了友好的用户界面和可视化结果展示.  相似文献   

12.
0IntroductionChina is a country with most of its territorycovered by mountain region.Every yearmountain hazards are responsible for disasters andcatastrophesin mountainous area,of whichlandslideis especially outstanding.It has caused the greatthreat to lives and property and has restricted eco-nomic development.Landslide forecast,as an effec-tive measure,plays ani mportant rolein hazard miti-gation.Great progresses have been achievedin sin-gle landslide forecast up to now.Many methods,fromFa…  相似文献   

13.
ARIMA模型是一种很重要的时间序列数据挖掘模型,但是这个模型往往只是对某个时间点进行研究.事实上一段时间往往影响未来的预测结果,就ARIMA模型的数据挖掘方法进行改进,并用美国IT界的股票价格数据对改进的模型进行了实证分析.结果显示改进后的模型与未来股票价格的预测更加准确.  相似文献   

14.
以常州站点为例,收集了2000—2017年历史气象观测数据和2011—2015年历史天气预报数据,以FAO56-PM公式的估算结果为对照,分别对Hargreaves-Samani模型、多元回归模型与傅立叶分析模型进行率定和验证,并以2016-04-21至2017-10-24逐日1~7 d天气预报数据为依据,分析评价3种率定模型的ET0预报精度。结果表明:率定后的MR模型在1 d、4 d、7 d预见期的平均绝对误差为0. 751 mm/d,准确率为87. 2%,预报精度均优于HAR模型与FA模型;均方根误差除在3d预见期时略高于HAR模型外,其他预见期均最小。考虑到天气预报准确率随预见期增加而降低,建议预见期不宜大于3 d。进一步在季节尺度下的精度比较显示,MR模型在各季节1~3 d预见期的预报精度均高于HAR模型与FA模型,总体预报精度最高。因此,建议采用MR模型对常州站点进行ET_0预报。  相似文献   

15.
贝叶斯网络的建造及其在数据采掘中的应用   总被引:40,自引:0,他引:40  
贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探讨 Bayesian网络的适用性。与数据采掘的其它方法相比 ,Bayesian网络的优点是可以综合先验信息和样本信息 ,这在样本难得时特别有用 ;可以发现数据之间的因果关系 ,适合于处理不完整数据集 ,这是其它模型难以做到的。其缺点是计算开销较大 ;确定合理的先验密度比较困难 ;如何判定实际问题是否满足所要求的假设 ,没有现成的规则  相似文献   

16.
Recent advances in computing, communications, digital storage technologies, and highthroughput dataacquisition technologies, make it possible to gather and store incredible volumes of data. It creates unprecedented opportunities for largescale knowledge discovery from database. Data mining is an emerging area of computational intelligence that offers new theories, techniques, and tools for processing large volumes of data, such as data analysis, decision making, etc. There are many researchers working on designing efficient data mining techniques, methods, and algorithms. Unfortunately, most data mining researchers pay much attention to technique problems for developing data mining models and methods, while little to basic issues of data mining. In this paper, we will propose a new understanding for data mining, that is, domainoriented datadriven data mining (3DM) model. Some datadriven data mining algorithms developed in our Lab are also presented to show its validity.  相似文献   

17.
为了满足不同用户在不同条件下对空间数据挖掘的不同要求,该文提出空间数据挖掘视角。空间数据挖掘视角在描述不同数据挖掘需求的基础上,利用一定的数据挖掘算法,从大量空间数据中发现不同粒度的空间知识。首先研究空间数据挖掘视角的内涵和外延,其次给出空间数据挖掘视角的算法,最后把空间数据挖掘视角应用于滑坡监测数据的挖掘,结果令人满意。  相似文献   

18.
随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi-Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collective data mining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性问题进行了归纳:1)结果质量问题,不考虑各个站点数据源间的内在语义联系,各站点独立挖掘本地数据,与其他站点间无语义层面的数据交互或融合,形成纯粹的"分割式"挖掘,最终导致全局结果质量受损;2)挖掘效率问题,如何调度资源以平衡挖掘负载、减少协作挖掘中的通信开销问题。针对结果质量问题,探讨本体与数据挖掘的结合。作为语义网的基础,本体能为对象语义距离度量提供有效支持。当前,在利用本体描述挖掘任务的领域背景方面,利用本体描述DM过程本身方面,都已经有研究人员进行了探索性工作:针对关联规则挖掘中需要从海量规则中遴选有效规则的问题,提出了交互式的、用于删减冗余规则的挖掘后处理方法;针对在给定知识发现过程的输入和输出类型前提下,知识发现工作流的自动构造问题,提出了解决方法。通过阐述可知,为了提升分布式挖掘过程中局部结果和最终结果的质量,策略之一就是将DDM理论和本体理论作融合,以数据源间语义距离的度量为突破口,建立语义距离度量的复合量化体系,通过构建和求解新型DDM模型来实现目标。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号