首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于数据挖掘的网络业务流分析方法   总被引:1,自引:0,他引:1  
为了从业务角度对网络的性能进行评价和优化,提出了一种新的网络业务分析方法——具有时态路径约束的关联规则挖掘分析方法.该方法以网络业务为分析粒度,以与网络业务流相关的时态属性和路径属性为约束条件,对已经积累的反映网络状况的海量历史数据进行挖掘分析.在进行关联规则挖掘时,利用频繁数据项集的性质,通过引入事务标号,在求出候选频繁项集的同时也求出其支持度,避免了为求支持度而进行的扫描数据库运算,极大提高了挖掘的效率和速度.实验结果表明,进行挖掘分析的数据量越大,该方法的性能和效率就越好.  相似文献   

2.
现有自底向上的角色工程方法挖掘规模庞大,系统管理任务繁重,且挖掘结果未能反映系统功能的安全需求.为优化角色挖掘,从终端用户的角度出发,将角色挖掘问题转化为聚类问题,提出一种面向用户的约束角色挖掘优化.该方法利用用户聚类四元组及角色约束优化挖掘过程,以综合评价挖掘效果及系统的安全性,并在构造和真实数据集上进行测试与分析.实验结果表明,该方法能够减轻系统的管理负担,并能保证信息系统的安全性.  相似文献   

3.
不完全信息系统的粗集Web挖掘方法   总被引:1,自引:0,他引:1  
针对电子商务环境下的客户关系管理的特点,提出了基于粗集理论对不完全信息系统的Web挖掘方法.从 已知数据的原始决策表出发,利用基于粗集的Web挖掘方法,选用某种评价算法,以得到决策表及每个数据对象的 决策规则.并结合算例,说明这种Web挖掘方法的使用.  相似文献   

4.
应毅  任凯  曹阳 《科学技术与工程》2013,13(5):1205-1209
基于单一服务器的Web挖掘系统在处理海量数据集时计算能力不足,针对该问题,提出了一种基于云计算的挖掘方法。将大数据集和挖掘任务分解到多台计算机上并行处理。实现了一个基于Hadoop开源框架的并行Web挖掘平台,同时提出了一种改进的MapReduce模型——MapReduce-LP。并通过对电子商务系统中Web日志的挖掘工作验证了系统的有效性和新模型的高效性。实验表明,在集群中使用云计算技术处理大数据集,可以明显提高挖掘效率。  相似文献   

5.
时态知识/数据模型研究及应用   总被引:3,自引:0,他引:3  
时间是信息的重要属性,不仅数据有时态性,而且知识也有时态性.时态信息在信息系统中扮演着日益重要的角色,在某些系统中还起着关键性作用.将时态应用分为完全时态应用、嵌入式时态应用和混合型时态应用3种模式,提出一种时态信息模型,重点讨论时态数据模型和时态知识表达模式,介绍典型时态信息系统"工资智能决策支持系统"中的知识/数据处理模型.  相似文献   

6.
李作春  周秀梅  覃泽 《科技咨询导报》2009,(28):236-237,239
针对存在的关联规则挖掘算法不能有效地在异质数据集中进行,本文首先使用领域本体方法处理数据集中的异质现象,然后提出了一种有效的XML异质数据集关联规则挖掘算法,实验结果表明该算法在挖掘速度和挖掘时在对内存的占用方面都优于现有的算法。  相似文献   

7.
一种网络日志挖掘的高效算法   总被引:1,自引:1,他引:0  
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。  相似文献   

8.
基于模糊关联迭代分区的挖掘优化方法研究   总被引:2,自引:2,他引:0  
由于数据库存在数据量大、多维性的特点,传统挖掘方法在对数据进行处理时,无法构建精准的数学模型,容易出现部分信息丢失、分区过硬的问题。提出一种基于模糊关联迭代分区的挖掘优化方法,通过模糊C均值聚类算法对原始数据集进行预处理,过滤冗余数据,获取原始数据集的模糊分区;利用模糊关联挖掘算法获取感兴趣规则,实现数据的优化挖掘。实验结果表明,针对不同的数据集,改进的方法均具有很好的分区性能,且时间复杂性低,挖掘精度高。  相似文献   

9.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

10.
频集挖掘是关联规则挖掘的关键步骤,它对强规则、相关分析和时间序列有着重要的意义.常用的频集算法包括Apriori和FP-G rowth.为了提高算法效率,提出了一种基于D iffset的混合算法———D iffsetHybrid,该算法根据数据集的稀疏程度决定采用D iffset的某种形式来挖掘频集,减少了存储空间,提高了算法效率.试验表明,该算法对于稀疏数据集和稠密数据集都有良好的计算性能.  相似文献   

11.
提出一种时序Rough逻辑,定义了时序算子及其作用于Rough逻辑公式上的意义.描述了这种逻辑的语法和语义.论述了时序Rough逻辑中的语义模型是一个无限状态序列,其中每一状态都描述了当前时刻和场景点上信息系统的信息.从当前状态到下一状态的变换是遵循时序Rough逻辑演算的,它必须保持知识不变,也就是属性和讨论的对象不变,而属性关于对象的特征值,即属性值随着时间和场景变化而可以变化.因此。在信息系统上作决策、数据约简和信息粒化等都将产生影响,由此可见时序Rough逻辑将是动态地处理信息系统的理论工具,也将是合理地解决和处理不一致信息表的较好方法.  相似文献   

12.
粗糙集作为数据挖掘工具,主要通过分类数据得到预测型知识,但分类规则过于严格,使得在挖掘带噪音的数据时,挖掘结果可能会损失一些有价值的规则.提出一种带不确定因子的信息系统及相应的分类方法,改进了传统粗糙集的分类方法.  相似文献   

13.
为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型.它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式.其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式.该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程.实验结果表明了该模型及算法的有效性和优越性.  相似文献   

14.
基于粗糙集理论不完备信息系统的数据挖掘   总被引:3,自引:0,他引:3  
提出了一种基于推广的粗糙集理论直接在不完备信息系统上进行数据挖掘的方法,并给出了该方法的算法和实例.该方法利用粗糙集理论直接对不完备信息系统进行知识约简,然后根据获得的约简集建立知识层次树,利用规则的支持度阂值s0和置信度阈值c0从知识层次树的压缩搜索空间中提取不完备系统的规则集,该方法保持了原始数据和数据挖掘所获得的知识的真实性,另外,还提出了知识规则的上、下支持度,上、下置信度,规则粗糙度等概念,以便指导用户更好地利用数据挖掘所获得的知识.  相似文献   

15.
用粗糙集进行数据挖掘是近年来被采用的一种新的有效方法 ,本文针对传统粗糙集分类方法过于严格 ,对噪音过分敏感的缺点 ,提出了改进的粗糙集挖掘模式及相应面向属性的约简算法和实现步骤  相似文献   

16.
通过分析年径流时间序列的特性,利用信息扩散近似推理描述年径流量间的复杂非线性关系,建立起基于信息扩散近似推理的年径流预测模型。信息扩散近似推理将样本点转换成模糊集,部分弥补了由于数据的不完备性所造成的信息空白,并可以将矛盾模式转换成兼容模式。通过与传统预测方法相比较,发现该模型能够很好地光滑样本数据以及能够较好地发掘知识,有较高的预测精度和推广应用价值。  相似文献   

17.
叶灵伟  张欣  王勇 《科技信息》2007,(17):179-179,93
粗糙集理论是一种新的处理模糊和不确定性问题的数学工具。本文介绍了粗糙集理论,讨论了用粗糙集理论进行数字图像增强处理的新方法。  相似文献   

18.
针对商务决策支持系统中存在信息不确定、冗余数据量大的问题,提出了一种基于Rough Set理论的提取最小规则算法。该算法的核心是改进的分明矩阵属性约简和启发式的属性值约简。通过算法对原始数据表中的冗余属性和属性值进行约简,得到了决策表和最小决策规则。最后,对商务决策支持系统的实例进行数据约简,挖掘其中的隐含知识,获取了有价值的决策信息。  相似文献   

19.
线性/非线性时间序列模型一般表达式及其工程应用   总被引:1,自引:0,他引:1  
提出一种线性/非线性时间序列模型的一般表达式(GNAR),论述其线性和非线性特性.对3种典型的非线性、非平稳时间序列进行试验及应用研究.将样本数据分成训练集和测试集,在训练集上建立GNAR模型,采用最小二乘方法以及结合预测误差的修正AIC准则实现其参数估计和模型定阶.在测试集上进行预测,进而验证模型.结果表明该模型对3组数据跟踪性能良好,预测预报精度优于传统时序模型,因此该模型有良好的适应性和有效性,能应用于工程实际.  相似文献   

20.
不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难.本文提出一种基于最小描述长度原则的不完备数据处理方法,实例证明这种方法是有效的.Rose工具的规则提取结果证明此方法在规则的集中性和支持度方面优于粗糙集辨识矩阵方法和Conditioned mean completer方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号