共查询到19条相似文献,搜索用时 99 毫秒
1.
在R&D统计领域,传统的统计数据分析方法已经难以胜任社会发展的需要。基于数据挖掘的基本原理与方法,首先界定了R&D的科技数据统计的内容与统计工作步骤,分析了在R&D统计研究中运用数据挖掘的主要方法及其重要作用,进而给出了R&D统计数据挖掘的操作流程,最后提出了R&D统计数据挖掘中的进一步设想。 相似文献
2.
3.
4.
王晓燕 《甘肃联合大学学报(自然科学版)》2010,24(4):68-71
主要讨论了常用的异常数据挖掘方法,简要地介绍了异常数据挖掘的定义、功能、方法等,详细的介绍了使用统计、距离、偏离技术、密度和高维持数据进行异常数据挖掘的方法并分析了其各自的特点. 相似文献
5.
双重区间值聚类挖掘模型 总被引:1,自引:1,他引:0
提出了双重区间值聚类的数据挖掘模型:首先将每个属性的取值按照领域知识划分为若干类。接着统计每个类在各条“交易”中出现的频率(支持度),最后再按照关联规则挖掘方法进行处理.这种区间值数据挖掘方法与传统的数据挖掘方法相比较,更有实用价值. 相似文献
6.
分类发现是数据挖掘的一个重要任务,Bayes统计推断是数据挖掘中数据分类的主要方法也是其基础之一。建立在粗糙集基础上,利用概率工具以及Expectation-Maximization思想(RUBIN算法)和Bayes统计推断规则的结合提出了分类的方法和步骤,并给出实例分析,重点是RUBIN算法和Bayes统计推断规则相结合在粗糙集上建立的决策方法。 相似文献
7.
分类发现是数据挖掘的一个重要任务,Bayes统计推断是数据挖掘中数据分类的主要方法也是其基础之一。建立在粗糙集基础上。利用概率工具以及Expectation-Maximization思想(RUBIN算法)和Bayes统计推断规则的结合提出了分类的方法和步骤,并给出实例分析,重点是RUBIN算法和Bayes统计推断规则相结合在粗糙集上建立的决策方法。 相似文献
8.
在统计方法的基础上提出了一种根据数据集合本身的统计特性数据挖掘算法.该算法利用数据本身的统计特性对数据仓库中的数据进行分析,在给定重要性比例程度的前提下,经过系列的统计运算,得到简化的数据仓库集,并根据分析得到了数据挖掘算法的流程图.提出了比例大小关系函数,反映了数据自身的统计特性,分析表明:这种算法极大的提高了数据的有效水平。 相似文献
9.
周桂如 《甘肃联合大学学报(自然科学版)》2009,(Z2):29-31
讨论了统计学方法在数据挖掘中的应用与联系,包括贝叶斯分类法和用于连续值预测的线性回归统计技术建模,以及基于统计学的概念聚类方法. 相似文献
10.
11.
12.
13.
聚类算法是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法.目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成绩。但是由于聚类算法的多样性,使其在很多行业应用中有着不同的应用效果,基于此。本文通过聚类算法三种指标的比较,给出了一种聚类方法应用效果评估的方法.该方法结合电信的案例应用与K-Means、SOM、BIRCH等聚类方法结果的分析,最后得出K-Means方法在电信客户细分中的应用优越性. 相似文献
14.
数据挖掘技术在电子商务中的应用 总被引:1,自引:0,他引:1
对于企业而言,数据挖掘有助于发现业务发展的趋势,帮助企业做出正确的决策,使企业处于更有利的竞争位置。数据挖掘中应用的技术包括经典的统计、邻近、聚类,也包括最新发展起来的决策树、神经网络和关联规则等一些较新的方法。当实际开发一个数据挖掘系统时,究竟应该选择哪种数据挖掘技术,往往是一件很困难的事情。本文结合数据挖掘技术在电子商务中的应用,提出选择数据挖掘技术的两个重要依据,以便开发出有效、实用的数据挖掘系统。 相似文献
15.
公路隧道交通流的数据挖掘 总被引:3,自引:0,他引:3
在阐述数据挖掘技术和方法的基础上,研究了基于统计理论的聚类方法。利用微软SQL Server 2000提供的聚类数据挖掘方法对某个公路隧道交通流的数据进行了聚类分析,并对数据结果进行了详细的解析,得到该隧道交通流的一些特性信息,如:何时该隧道交通流最大等。根据这些信息,可以针对不同的交通量特点安排隧道监控设备的控制方案及系统的维护方案,以保障公路隧道交通的畅通和安全。 相似文献
16.
网站用户偏好度的数据挖掘模型 总被引:2,自引:0,他引:2
数据挖掘和数据库知识发现是当前国际科技界的一个研究热点。这是一个介于统计学、模式识别、人工智能、机器学习、数据库技术以及高性能并行计算等领域的交叉新兴学科,具有极为广泛的应用前景。在基于统计学观点的基础上讨论了网站用户偏好度的数据挖掘模型,设计了一个网站用户信息浏览偏好度的数据挖掘模型。 相似文献
17.
为面向可拓建筑设计进行可拓数据挖掘, 以可拓建筑设计数据为对象, 探讨将其转化为高质量的结构数据的流程与方法。根据跨行业数据挖掘标准流程(CRISP-DM), 建立包括基元化表达、数据表设计、数据筛选、数据形式变换、变量标准化处理和变量维数约简6 个步骤的数据准备流程, 并根据建筑学专业特点, 结合可拓学、几何学、统计学理论, 设计各步骤的操作方法, 构建出完整的数据准备流程与方法。案例检验结果表明, 按照该流程及其操作方法, 可有效地将可拓建筑设计数据转化为统一格式、高信度、量化且可运算的结构数据。 相似文献
18.
贝叶斯方法是概率统计学中一种很重要的方法。贝叶斯网络就是根据各个变量之间概率关系用图论方法建立的模型,本将概率统计的贝叶斯规则应用于知识发现,建立图论模型进行数据挖掘,章最后应用贝叶斯网络对于实际的数据库进行知识发现,其结果说明了这种方法的有效性。 相似文献
19.
数据挖掘与智能化信息处理研究 总被引:2,自引:0,他引:2
数据挖掘(Data Mining)是智能化信息处理中一个很有价值的课题,它融合了数据库、人工智能、机器学习和统计学等多个领域的理论和技术。本文介绍数据挖掘系统的体系结构、数据挖掘的任务、方法及应用,讨论了数据挖掘研究的发展趋势。 相似文献