期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探讨 Bayesian网络的适用性。与数据采掘的其它方法相比 ,Bayesian网络的优点是可以综合先验信息和样本信息 ,这在样本难得时特别有用 ;可以发现数据之间的因果关系 ,适合于处理不完整数据集 ,这是其它模型难以做到的。其缺点是计算开销较大 ;确定合理的先验密度比较困难 ;如何判定实际问题是否满足所要求的假设 ,没有现成的规则相似文献

6.

改进的关联规则采掘算法及其实现 总被引：7，自引：0，他引：7

施润身赵青《同济大学学报(自然科学版)》2002,30(2):222-225

在现有的关联规则采掘算法的基础上，进一步分析了经典算法的内涵，提出了生成大项目集优化时减少对交易数据库扫描次数的改进算法，并给出改进后的算法描述。在DBMS平台上用数据查询语言实现关联规则的采掘。结果表明，改进的算法对关联规则的采掘十分有效。相似文献

7.

概念树方法在F--KDD中的应用研究

谢印宝鹿宏《山东理工大学学报：自然科学版》2001,15(4):30-33

数据采掘是数据库中知识发现的核心,详细描述了数据采掘中概念树方法在模糊性问题中的应用. 相似文献

8.

VDM算法在数据采掘中的应用

王继承朱明富《华中科技大学学报(自然科学版)》2001,29(Z1):90-92

介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法.值差分度量算法原本是用于计算离散属性值间的距离,但实际上将这种方法反过来用于连续属性的离散化也可以有相当好的效果.将其与传统的使用统计量χ2的离散化算法作了比较. 相似文献

9.

大数据可视化技术及应用

沈恩亚《科技导报(北京)》2020,38(3):68-83

随着人类产生数据量的增加,数据可视化需要处理的数据规模、类型及需求都发生了显著变化。在大数据时代,数据可视化面临诸多新的挑战。从大数据本身的特点及其应用需求出发,结合数据可视化的研究现状,介绍了适用于大数据的数据可视化技术;分析在大数据条件下数据可视化所要解决的8个关键问题;讨论了针对大数据可视化应用需求自主研发的交互式可视化设计平台AutoVis及其应用。相似文献

10.

基于粗糙集理论的分类规则发现 总被引：25，自引：0，他引：25

印勇曹长修《重庆大学学报(自然科学版)》2000,23(1):63-65,73

研究了利用粗糙集理论中核的概念,求取信息系统的最小简化策略,给出了从数据库中发现分类规则的方法。相似文献

11.

聚类数据挖掘可视化模型方法与技术

谢庆华张宁蓉宋以胜王海波岳振军《解放军理工大学学报(自然科学版)》2015,(1):7-15

面向通用数据资源,研究聚类数据可视化方法与技术,旨在探索有效的数据处理方法,满足信息领域对高维数据处理的要求。通过对高维数据进行降维处理和可视化映射实现,建立K均值算法的聚类数据挖掘可视化系统模型,实现中间聚簇结果、聚类中心、收敛准则函数值三类要素的可视化。利用加利福利亚大学欧文分校(UCI)数据库中的Iris数据集、Wine数据集、Seeds数据集对可视化系统模型方法进行测试。结果表明,该模型实现了对数据集的有效聚类,能够将中间聚类、聚类中心、收敛准则函数值进行实时有效的可视化表达,达到了预期效果。相似文献

12.

生物序列数据挖掘技术研究

杨恒宇《合肥工业大学学报(自然科学版)》2012,(9):1212-1216

生物序列数据是生物信息数据中重要的一部分,研究生物序列解读其隐含的生物学意义是生物信息学研究的热点和难点。数据挖掘是当前分析大规模数据的有效工具之一,已广泛应用于分析生物序列数据,并取得了许多研究成果。文章综述了生物序列数据挖掘的关键技术,包括序列比对算法、DNA序列模式挖掘、关联、分类、聚类分析、RNA二级结构预测、蛋白质序列分类和聚类分析,最后展望未来研究方向。相似文献

13.

数据挖掘技术的常用方法分析

《云南大学学报(自然科学版)》2011,33(Z2):173-175

介绍了数据挖掘的概念及任务,阐述了数据挖掘技术中的常用方法和Apriori算法,并对数据挖掘的一些算法作了简单分析. 相似文献

14.

数据挖掘技术在网络入侵检测中的应用 总被引：4，自引：0，他引：4

刘军《南京工业大学学报(自然科学版)》2006,28(2):79-84

论述了入侵检测系统的基本概念，针对目前入侵检测系统中存在的问题，提出了一个基于数据挖掘技术的自适应入侵检测系统模型。介绍了该系统模型的基本思想，阐述其结构及主要功能，着重分析了该系统的数据挖掘和检测过程。利用数据挖掘技术自动地从大量数据中提取重要的特征和新的模式，生成有意叉的规则并建立检测模型，实现对分布式拒绝服务攻击DDoS（Distrbute Denial of Service）入侵的检测方法。相似文献

15.

数据挖掘技术在管理与决策中的应用 总被引：2，自引：0，他引：2

张捍东许宝栋杨维翰汪定伟《华中科技大学学报(自然科学版)》2002,30(6):73-75

利用数据挖掘技术和模糊关系数据库能够分析和处理大量复杂数据关系进而发现有知识和模式的优点，将两者结合应用于企业战略管理与决策过程中，在分析企业的内外部运行环境时，通过建立模糊近似关系，对相关模糊区域进行最优划分，从而识别企业的运行模式，确定出所涉及的每一企业在竞争市场中的相对地位，为企业进一步制定和实施发展战略，最终实现科学的战略决策，提供了有力的依据。相似文献

16.

Domain-oriented data driven data mining:a new understanding for data mining

WANG Guo yin WANG Yan 《重庆邮电大学学报(自然科学版)》2008,20(3):266-271

Recent advances in computing, communications, digital storage technologies, and highthroughput dataacquisition technologies, make it possible to gather and store incredible volumes of data. It creates unprecedented opportunities for largescale knowledge discovery from database. Data mining is an emerging area of computational intelligence that offers new theories, techniques, and tools for processing large volumes of data, such as data analysis, decision making, etc. There are many researchers working on designing efficient data mining techniques, methods, and algorithms. Unfortunately, most data mining researchers pay much attention to technique problems for developing data mining models and methods, while little to basic issues of data mining. In this paper, we will propose a new understanding for data mining, that is, domainoriented datadriven data mining (3DM) model. Some datadriven data mining algorithms developed in our Lab are also presented to show its validity. 相似文献

17.

数据挖掘方法的评述 总被引：2，自引：0，他引：2

糜元根《南京工业大学学报(自然科学版)》2001,23(5):105-110

决策离不开知识,从数据库中采掘知识,是解决从大信息量中获取有用知识的有效途径.但是在实际数据库中,数据的复杂性(如信息量大、噪声等)对数据挖掘方法提出了比机器学习更高的要求,这方面的研究正受到越来越多的关注.本文就当前数据挖掘的几种主要方法,即神经网络、决策树、粗集和云模型等方法的研究现状进行了评述,指出其存在的问题.从总体上看,这些方法都有局限性,但它们的有机组合具有互补性,多方法融合将成为数据挖掘的发展趋势,最后指出数据挖掘方法面临的挑战. 相似文献

18.

利用文本数据挖掘研究p53基因表达调控网络

舒坤贤余庆李津臣吴咏竹《重庆邮电大学学报(自然科学版)》2012,24(6):798-803

为了研究p53基因与其下游/靶基因的关联性,以了解p53基因表达调控网络,采用文本数据挖取方法,利用自编的Perl 5.10程序,对PubMed文献数据库中p53基因相关文献及人类基因本体数据库进行数据挖掘,并利用连锁聚类法构建p53基因表达调控网络图.结果发现,目标基因的频率分布同文本中所有基因本体的频率分布存在一定的关联性,低频基因的文本挖掘比例明显低于高频基因的文本挖掘比例.从而说明,p53基因表达调控网络中各基因的分布情况与基因频率有较大关系,而文本数据量对文本数据挖掘的准确率也有重要影响. 相似文献

19.

基于粗糙信息颗粒的数据挖掘方法研究

彭玉楼陈曦《湖南科技大学学报(自然科学版)》2004,19(4):67-69,94

大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8. 相似文献

20.

基于神经网络的数据挖掘方法评述 总被引：1，自引：0，他引：1

方诗虹刘玉萍《西南民族学院学报(自然科学版)》2007,33(4):957-960

简要叙述了数据挖掘的概念及几种主要的基于神经网络的数据挖掘方法,并对这些方法的研究现状进行了评述,指出其存在的问题.展望神经网络在数据挖掘中的发展潜力. 相似文献