首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CRHD,并通过UCI中的多个数据集和已有算法进行仿真实验对比,证明了CRHD算法的有效性.  相似文献   

2.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

3.
为了解决数据挖掘过程中挖掘的知识粒度过粗或过细问题,并利用概念格的偏序特性,提出了一种基于量化概念格的属性归纳算法.首先对概念格的外延进行量化,得到量化概念格,再根据概念格的哈斯图,采用概念的爬升进行相应的泛化,从而获得基于量化概念格的多层、多属性归纳.与面向属性归纳(AOI)算法相比较,结果表明所提算法不仅能实现AOI的单一属性归纳,还能进行多层、多属性的归纳,其属性泛化的路径不是惟一的,并且很容易在量化概念格的哈斯图中寻找合适的泛化路径和阈值,以此得到用户要求的、合理的属性归纳结果.  相似文献   

4.
借助于近似极大值函数的凝聚函数,将传统数据聚类问题转化为无约束优化问题求解.首先利用一阶必要条件,推导出数值属性下数据聚共中心的计算格式;其次采用类属性分解方法,提出计算类属性数据对象之间距离的新方法,井在此基础上给出混合属性下数据聚类中心的计算格式和一个能处理数值型和分类型混合数据集的凝聚聚类算法;最后选取不同初始聚类中心,使用凝聚聚类算法对英语借词进行了聚类实验和分析.结果表明,凝聚聚类算法在计算效率和计算效果方面均优于模糊k-prototypes聚类算法.  相似文献   

5.
在有效处理噪声数据的基于区分能力大小的启发式算法的基础上,引入了属性的相对知识量重要度的概念.以属性相对知识量重要度为启发式信息,提出了一种属性约简算法,通过实例证明了该算法的有效性.  相似文献   

6.
在时序数据库中,有许多成熟的技术和方法用来对布尔型属性之间的关系进行挖掘,但对于数值型属性变化趋势关联关系的研究却不是很多.本文提出了一种数值型属性变化趋势的研究模型QMP(QuantityMovementPattern),依据该模型可利用数据挖掘算法发现不同数值型属性之间变化趋势之间的关系.文中分析了该模型的几种实现算法,并给出了一种快速实现算法及实验数据.  相似文献   

7.
模糊规则发现算法研究   总被引:3,自引:0,他引:3  
引入最小强度的概念来限制模糊属性集的搜索范围,提出一种能发现强模糊规则的快速算法.此算法利用Apriori算法的搜索技术来发现强模糊规则,因此具有较高的算法效率,并有效地解决了模糊系统的维数灾难问题.在快速算法的基础上,又提出一种能发现固定数目的强模糊规则的划分算法.该算法将数据库划分成多个子数据库,并在于数据库上通过发现划分强模糊属性集来限制全局强模糊属性集的搜索范围.实验表明,划分算法比快速算法更节省时间.  相似文献   

8.
针对k等价度容差关系,提出了一种基于k等价度容差关系的变精度粗糙集模型,该模型是变精度粗糙集模型在不完备信息系统中的拓展.在此基础上,定义了变精度粗糙集模型约简的概念,讨论了一种刻画属性重要性的新指标,提出了一种启发式约简算法.该算法能从搜索空间中不断地添加重要的属性,并且删除不重要的属性,从而降低了约简的时间复杂度.最后,通过实例说明该算法的有效性.  相似文献   

9.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

10.
算法采用了一种新颖的质数编码方式,将数据库属性项压缩为一个数值型的项,把原来用字符串表示的记录转化为用一个合数表示,进而把字符串比较转化为数值运算.通过引入频繁项集估计数目,使算法总是在频繁项密集区进行挖掘,对搜索空间进行了有效修剪.实验表明,算法对数据库压缩比超过25%,效率至少能提高49%.  相似文献   

11.
一种基于概念层次的分类规则挖掘算法研究   总被引:7,自引:1,他引:6  
从概念层次的角度,提出了一种新的基本概念层次的分类规则挖掘算法,并阐述了相关概念及属性归纳技术与相关性分析方法,以城市人口与收入信息数据库和测试数据,给出了该算法的试验结果,研究结果表明,本算法生成的决策树大小适合,具有高的分类规则挖掘效率。  相似文献   

12.
随着计算机技术的发展,数字化图书馆应运而生。本文介绍了数字化图书馆的概念及特征、数字化资源的建设、数字化图书馆的基本层次结构,并根据以上内容提出数字图书馆的模式建构。  相似文献   

13.
基于概念层级和分层挖掘的非单调数据挖掘算法   总被引:1,自引:0,他引:1  
引入概念层级和采用分层挖掘处理数据挖掘中的非单调性,提出了结合粗糙集和概念层级的非单调规则挖掘算法,以及基于混合知识模型和分层挖掘的非单调数据挖掘算法,通过一故障诊断实例,阐明了该算法的原理,并介绍了基于遗传算法的模糊规则自动生成和故障诊断神经网的构造。  相似文献   

14.
在数字振荡器产生任意波形的原理的基础上,提出一种利用改进的数字振荡器算法产生高精度任意波形的方案.这种方案基于DSP(digital signal processing)技术,占用系统资源少,波形参数易于调节.最后利用该方法设计一个基于DSP和PC机的波形参数随时可调的正/余弦发生器,并对工作原理和软硬件设计过程进行了详细叙述.  相似文献   

15.
为了表示复杂庞大的概念层次树,文中提出了一种更加通用的编码方案,将概念分层应用于模糊关联规则的挖掘.此外,为解决隶属度函数难以主观确定的问题,引入一种SOFM网络来确定样本数据的隶属度函数.基于改进的概念层次树的编码方案和SOFM网络,将模糊集引入关联规则挖掘中,设计了一种新的多层模糊关联规则挖掘算法.实验结果表明,该算法可以有效地挖掘出易于理解的、有意义的多层次模糊关联规则,具有很好的效率和伸缩性.  相似文献   

16.
一种光通信系统可用度计算方法   总被引:1,自引:0,他引:1  
为了研究光纤通信系统无中断工作的能力 ,计算通信系统可用度具有重要的意义。在 ITU- T G.911光通信系统可用度计算的基本原则下 ,建立了系统状态的 Markov模型和状态转移概率矩阵 ,并利用稳态 Markov模型中状态转移概率平衡的特点求解稳态概率。再利用网络拓扑结构和保护机制的信息 ,通过简单的概率运算得到系统的稳态可用度。在这种计算方法的基础上分析了 SDH的自愈保护机制以及各种故障对系统可用性的影响。在计算结果的指导下 ,可以知道为了达到特定的可用度 ,通信设备和光纤必须具备的正常工作时间和出现故障后的最长修复时间  相似文献   

17.
提出层次多结点样条曲线逼近算法,使得逼近的过程能够根据设定阈值自动的选择最优逼近段数。同时,引入最优逼近曲线判定方法,实验表明该方法对于γ射线能谱等离散数据的平滑具有良好效果。  相似文献   

18.
形式概念内涵的一种快速求法   总被引:2,自引:2,他引:0  
形式概念分析理论对于知识发现、信息检索、机器学习、软件工程等领域是一种很有效的研究工具。在它的应用中,概念的快速求法具有举足轻重的作用,研究人员已经提出了许多求概念的算法,这些算法都离不开形式背景并不可避免地对形式背景进行多次访问,对于大的形式背景来说,会大大降低算法的效率。提出用属性树方法求概念的内涵,只对形式背景进行一次扫描,就可以求出全部概念的内涵,从而可求出所有的概念。实验表明,该算法的效率要高于Ganter算法的效率,并且可以进行并行计算。  相似文献   

19.
提出一种将任意数字组合电路转变为检测电路的方法和检测电路的测试生成算法。对数字电路中所有引线的单固定故障都能产生测试向量,计算量的上限是2(m_1+4m_2) ̄2。  相似文献   

20.
为了解决目前无线ad-hoc网络安全路由协议中的签名算法运算效率较低,从而导致可实现性较差的问题,借鉴多维Hash链的思想,提出一种数字签名算法,并基于这种数字签名算法,给出一套无线ad-hoc安全路由协议的实例。该数字签名算法通过RSA(Rivest,Shamir,Adleman)体制中的模幂运算构造多维Hash链,形成公私钥对,对消息进行签名。通过减小模幂运算中指数的大小,达到降低运算量目的。实验结果表明:当密钥长度取1024bit时,该签名算法与RSA签名体制相比,运算量减小约20%,而其安全性依赖于RSA体制的安全性以及使用的Hash函数的安全性。该算法及协议使得无线ad-hoc网络中路由安全的部署的可实现性得到一定的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号