共查询到20条相似文献,搜索用时 640 毫秒
1.
函数依赖是关系数据库和数据建模中所需的关键约束知识。在海量数据中挖掘函数依赖时为降低噪音干扰和提高效率,该文采用带有满意度函数依赖的概念及挖掘带有满意度函数依赖的算法(MFDD),对噪音进行测度与表达,并有效挖掘得到函数依赖最小集。利用对属性散列度的测度概念,在带有满意度函数依赖的理论框架内采用3条优化策略,实现了属性预扫描算法。结果表明:基于该算法可显著提高挖掘效率。 相似文献
2.
函数依赖是关系数据库和数据建模中所需的关键约束知识。在海量数据中挖掘函数依赖时为降低噪音干扰和提高效率,该文采用带有满意度函数依赖的概念及挖掘带有满意度函数依赖的算法(MFDD),对噪音进行测度与表达,并有效挖掘得到函数依赖最小集。利用对属性散列度的测度概念,在带有满意度函数依赖的理论框架内采用3条优化策略,实现了属性预扫描算法。结果表明:基于该算法可显著提高挖掘效率。 相似文献
3.
基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条件值下的数据一致性问题并提供可用于一致性修复的参考值.同时,提出了一种一致性修复的代价模型.模型参考内容相关的条件函数依赖对应元组的实际情况进行修复,实现代价最优,同时保证数据一致性.通过在两组真实数据集上进行试验测试,证明提出的基于内容相关的条件函数依赖的一致性清洗方法能够准确地检测数据的一致性问题并加以修复. 相似文献
4.
5.
《浙江师范大学学报(自然科学版)》2020,(2)
为了明确启发式排序DFS,BFS和NDS的性能优劣及正确选择合适的排序策略和排序起点,采用实证研究方法,在比较DFS,BFS和NDS排序策略性能的基础上,研究排序策略选择和排序起点选择的指标数据.提出依赖集总长度小优先的排序策略和最佳排序起点的选择方法,并在工程网络中进行验证.结果表明:1)相比较于BFS和DFS,NDS能指导生成更小的BDD模型;2)指标数据依赖集总长度可以有效表征排序策略和排序起点;3)基于依赖集总长度小优先的选择方法有助于选出最优的排序策略和排序起点.该结果可以为选择和设计启发式排序策略提供理论依据. 相似文献
6.
《渤海大学学报(自然科学版)》2016,(3)
属性约简是模糊粗糙集理论的重要研究内容.本文引进了基于距离的模糊相似关系,建立了距离测度下的模糊粗糙模型,从而得到条件属性和决策属性之间的依赖函数,通过此函数构造了前向搜索属性约简算法.并利用了UCI标准数据集与现有算法进行比较,从而验证了该算法的可行性和有效性. 相似文献
7.
一种用于数据挖掘算法的数据生成方法 总被引:1,自引:0,他引:1
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程. 相似文献
8.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K-Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局-局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率. 相似文献
9.
基于现有排序算法的缺陷,提出了对大型数据库排序算法智能化的改进方案:定义了“有序度”函数描述待排数据的特点,并自适应地选择相应排序算法,极大地提高了对大量数据进行排序的效率.提出的新算法在一般情况下与“快速排序”效果相当;但在较差情况(待排数据基本上有序)下,效率则显著提高,是一种极具实用价值的算法. 相似文献
10.
《辽宁工程技术大学学报(自然科学版)》2016,(11)
为准确高效的完成数据的准备工作,提出在属性集不同、对象集相同形式背景下多区间概念格的动态横向合并算法.首先,为保证格结构的完整性,对区间概念格的渐进式生成算法进行改进,将区间概念分为存在概念、冗余概念和空概念;其次,结合区间概念格自身特点,给出区间概念格一致性的概念以及格结构横向合并的充要条件;再次,将合并后的区间概念分情况进行讨论,并给出相应的横向合并原理;最后应用层序遍历的方法扫描格结构,提出横向合并效率.实例表明,该算法的可行性和高效性. 相似文献
11.
12.
一种新的快速求核算法 总被引:2,自引:1,他引:2
为了解决核影响属性约简算法的速度和效率等问题,提出了一种基于正区域的求核算法.采用基数排序思想计算正区域,分别得到决策属性正区域的条件属性集和除决策属性正区域的一个条件属性之外的条件属性集,并且计算这2种属性集的基数之差,以判断该条件属性是否是核属性,依次判断所有条件属性,从而快速获得所需要的核.基于正区域求核算法的时间复杂度为O(|C||U|).实验结果表明,利用该算法求核,所耗时间将随对象数的增加呈线性增长,且当对象数最大时,求核所耗时间仅为对比算法的0.6%,同时证明了该算法对各种数据集均有很好的适应性. 相似文献
13.
提出了基于断点辨别力的粗糙集离散化算法.通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化.离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息.采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验.实验结果表明此算法是有效的,而且当候选断点个数增多时仍有较高的计算效率. 相似文献
14.
提出了一种基于Routh有限概念格的规则发现方法(RRLIRD),以揭示数据集中的蕴涵规则。首先引入有限概念格的简化表示形式,由用户选择数据集中感兴趣属性集创建概念格结构,提高用户的交互性和挖掘的效率;然后运用有限概念格与Rough集理论相结合形成Rough有限概念格,蕴涵规则则由其特有的上、下近似运算得到,不需计算繁琐的频繁项目集。算法运用大型超市的交易流水数据进行仿真实验。结果表明,执行时间比经典的Apriori算法大大降低。该算法也适用于证券行情分析和农业数据库的病虫害分析等。 相似文献
15.
针对欠定条件下的雷达信号分选问题,提出一种基于时频单源点检测的雷达信号盲分选算法,该分选算法的创新点在于将雷达信号由时域转移到时频域进行分析.在时频域内,雷达信号具有一定的稀疏性,有助于实现信号盲分选,给出了基于时频单源点检测的雷达信号盲分选算法的具体步骤.该方法能够有效解决欠定条件下雷达信号盲分选问题,将其应用于雷达信号分选领域,具有一定的军事应用价值.仿真测试结果表明了该方法的可行性与优越性. 相似文献
16.
决策树是数据挖掘中的一种重要分类方法。在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法。该算法具有较大的灵活性,能从测试属性空间逐次删除已使用过的属性。避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率。最后,实例验证了算法的可行性与有效性。 相似文献
17.
先建立求解加权最小闭包球(WMEB)问题的序列最小最优化(SMO)算法的线性收敛性, 再结合列生成算法的思想, 即每次迭代将与当前球
心加权距离最远的点加到核心集中, 并调用SMO算法, 提出一种求解WMEB问题的列生成算法. 数值实验结果表明, 该算法能有效提高求解大规模数据集上WMEB问题的计算效率. 相似文献
18.
面向单目标优化的集成粒子群算法 总被引:1,自引:1,他引:0
串行粒子群算法广泛应用于多个领域,出现了多个变种,但解决不同种类的优化问题时性能有差异.为提高串行粒子群算法对各种优化问题的适应能力,提出一种集成粒子群优化算法.新算法使用Matlab的单程序多数据并行结构发挥单节点多核计算能力,通过设置外部档案分享不同粒子群的全局最佳位置,促进不同串行粒子群算法之间的信息交流,综合利用不同串行粒子群算法在解决不同类型优化问题的优势.在广泛使用的测试函数集上开展仿真实验,结果验证了新算法的有效性,与多个知名的串行粒子群算法相比,新算法在寻优性能上优势明显.新算法不仅能够提高粒子群算法的适应能力,而且,所采用的算法框架也适应于其他群智能算法,改善了算法的性能. 相似文献
19.
提出了基于断点辨别力的粗糙集离散化算法。通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化。离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息。采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验。实验结果表明此算法是有效的,而且当候选断点个数增多时仍有较高的计算效率。 相似文献
20.
洪月华 《玉林师范学院学报》2011,(5):133-136
利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策表训练BP神经网络,再将构造好的BP神经网络集成在每个传感器节点上.仿真结果表明,该算法可以降低数据维数,消除冗余数据、减少网络通信量、延长网络寿命. 相似文献