首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为解决属性约简的诸多问题,比如基于信息熵的属性约简方法偏向多值属性的缺点,而基于属性相似度的属性约简方法偏向少值属性的不足,现提出一种将信息熵和属性相似度结合起来的新的启发式属性约简方法.实验结果表明,避免了上述两种属性约简算法的偏向性.  相似文献   

2.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

3.
针对图像检索中基于单一全局颜色特征或局部特征的检索方法存在查准率和查全率低等问题,提出了一种融合信息熵和改进尺度不变特征变换算法的图像检索方法。首先,利用改进的尺度不变特征变换算法提取图像的局部特征;然后,计算图像的全局颜色特征和信息熵;最后,利用信息熵动态分配全局颜色特征和局部特征的权重,计算图像间的相似度进行图像检索。实验结果表明:该方法的检索性能优于颜色直方图法和尺度不变特征变换算法。  相似文献   

4.
相似度计算是协同过滤推荐算法的基础,但由于用户之间共同评价项目数量稀少,导致传统的协同过滤算法无法准确计算用户之间的相似度,从而造成推荐质量不佳.通过在Pearson相似度计算公式中加入用户之间联系的惩罚因子,并在此基础上与评分信息熵进行融合,提出一种新的用户之间相似度计算方法.实验结果表明,该算法能够更准确地计算用户...  相似文献   

5.
针对目前的量子进化算法在高维函数优化时容易陷入局部最优,利用信息熵的概念,将量子进化算法和免疫遗传算法进行改进与融合,提出一种基于信息熵的量子免疫遗传算法.该方法对抗体采用相位编码,用信息熵准确地度量量子比特的不确定信息;提出了一种按变量的种群熵降序排列的邻域搜索策略;对于抗体之间的相似度,给出了一种按个体熵相同变量位数的度量方法;用繁殖概率对抗体的多样性进行评价,并分别以函数优化问题和VRPSDP问题进行了仿真验证.研究结果表明:该算法收敛速度快,求解精度高.  相似文献   

6.
针对基于信息熵和基于欧氏距离的免疫遗传算法存在的不足,提出了一种改进的免疫遗传算法(ⅡIGAE)。该算法重新定义了抗体相似度和期望繁殖率,从而提出了一种新的保持抗体群多样性策略。将ⅡGAE与D-ⅠGAE、IGAE、GAES相比较,仿真结果表明,ⅡGAE能很快收敛到最优解,并且解的波动小。  相似文献   

7.
一种改进的粗糙集属性约简启发式算法   总被引:43,自引:0,他引:43  
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性  相似文献   

8.
提出了一种面向翻唱歌曲识别的相似度融合算法。该算法将基于乐理特征的相似度和基于人耳感知特性的相似度融合,通过把基于节拍跟踪和瞬时频率音级轮廓(IF-PCP)的最大互相关相似度、基于和声音级轮廓(HPCP)的Qmax相似度、基于耳蜗音级轮廓(CPCP)的Q_(max)相似度映射到同一个多维空间,并计算其几何距离来进行相似度融合。该算法使得IF-PCP特征的节拍速度不变性、HPCP特征的和声优势、CPCP特征的人耳感知特性有效融合。为了验证算法的有效性,采用包含212首不同歌曲共502个版本的数据库作为测试对象,以平均正确率均值和TOP-N作为测试指标对算法性能进行测试。测试结果表明,与基于单一相似度算法相比,该融合算法可提高翻唱歌曲识别准确率。  相似文献   

9.
基于信息熵贴近度的旋转机械故障诊断   总被引:7,自引:1,他引:6  
基于信息融合的思想,研究了反映振动能量的旋转机械故障状态的各种信息熵特征,如奇异谱熵、功率谱熵、小波空间状态特征谱熵和小波能谱熵.通过转子试验,给出了旋转机械的不平衡、不对中、支座松动、轴裂纹典型故障下的各信息熵的变化范围.根据越相似的模式间距离越短原理,提出采用贴近度来进行模式识别的方法.首先利用贴近度原理和熵带构建了信息熵贴近度模型,其次计算出待识别状态与各典型故障之间的信息熵贴近度值,则对应于待识别状态之间的信息熵贴近度最大的即为待识别状态的故障模式,最后通过实例描述了基于信息熵贴近度的旋转机械故障诊断方法的可行性.  相似文献   

10.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

11.
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵作为属性约简的标准,提出了基于联合熵的知识约简算法;并给出了以支持度、兴趣度和准确度为阈值的有效关联规则算法.  相似文献   

12.
协同过滤是推荐系统中应用最成功的技术之一,现有基于项目的协同过滤算法在计算项目相似度时过度依赖用户对项目的评分数据,没有考虑项目间内在的关联性,导致推荐质量不高.为了全面客观地评估项目相似度,提出了一种基于频繁项集挖掘的推荐算法(BFIM).该算法提出将频繁项集作用于相似度计算中,可以提高相似度计算的准确性,进而提升推荐算法的推荐质量.实验结果表明:提出的改进算法较对比算法在公开数据集上能取得更好的推荐效果.  相似文献   

13.
针对谱聚类算法在处理较大规模的样本时,在存储空间和计算时间上都存在瓶颈问题,文章分析了目前常见的两种解决方式,即基于稀疏化t近邻的谱聚类和基于Nystr9m矩阵低秩逼近的谱聚类方法.为了进一步提高这两种谱聚类算法的准确度,提出了采取基于信息熵属性赋权的欧式距离来计算样本间的相似度的方法.首先,计算样本各属性的权重;然后,计算样本间的相似度矩阵并应用到稀疏化t近邻的谱聚类和Nystr9m矩阵低秩逼近的谱聚类方法中;最后,在多个数据集上进行了验证.实验结果表明该方法在一些数据集上的聚类精确度要比原来谱聚类算法高,尤其在Pendigits数据集上,基于信息熵赋权的稀疏化t近邻谱聚类比稀疏化t近邻谱聚类方法精确度提高15.11%.  相似文献   

14.
利用免疫算法对多峰值函数进行多峰值搜索及全局寻优能力,运用Matlab编程实现基于信息熵的免疫算法来求解Rosenbrock函数全局最大值,并对抗体进化过程和种群分布特征进行了仿真.讨论了免疫记忆、相似度与平均浓度的判断、抗体和抗原的亲和力以及多样性保持等功能的实现方法.  相似文献   

15.
针对空间分布的全局外观潜在变化的行人再识别问题,提出一种基于空间约束和二次相似度学习算法.通过二次相似度函数(QSF)估计每个子区域的相似度,从而形成多项式特征图,并将所有特征图融合到统一的框架中.该框架利用局部相似度和全局相似度的互补优势,结合多个视觉线索进一步提高算法的鲁棒性.实验对比3个公共数据集,结果表明:基于空间约束和二次相似度学习算法具有显著的识别性能.  相似文献   

16.
通过研究网络结构上的观点传播与协同过滤算法,基于对观点传播算法的优化,提出了基于用户相似和物品相似推荐系统评分预测算法.设计的算法修正了现有相似研究中在目标比较相似时,相似性结果为零的问题,将用户(或物品)的相似度定义为用户(或物品)间的观点数目和差异在相应复杂网络中的传播结果,并提出了相应的推荐算法.在MovieLens数据集上的实验结果证明,提出的算法与几种典型的现有方法相比较,具有更高的准确性,并且优于观点传播算法.  相似文献   

17.
 针对软件维护过程中不确定信息难以量化的问题,使用信息熵定量度量软件的维护风险.基于信息熵,引入信息熵定量分析算法,提出了软件维护风险模型,使用信息熵算法定量计算软件维护过程中的不确定程度和损失度.仿真结果表明,基于软件维护风险模型,使用信息熵算法能够定量度量软件的维护风险.  相似文献   

18.
一种改进的模糊聚类算法   总被引:10,自引:0,他引:10  
针对现有聚类算法在参数输入、停机条件等方面存在诸多人为控制因素的问题,采用信息熵理论使聚类标准客观化,同时结合模糊聚类的思想,以隶属度作为信息熵计算的基础,并采用谱系的方法确定聚类数目,从而改进模糊聚类算法.研究表明,提出的基于信息熵的算法能够比较客观、科学地反映实际聚类情况.  相似文献   

19.
一种改进的基于树路径匹配的网页结构相似度算法   总被引:1,自引:0,他引:1  
提出一种改进的基于树路径匹配的网页结构相似度算法, 该算法定义了树路径的序列相似度和位置相似度, 找出网页的树路径集合, 通过网页间的最佳树路径匹配计算结构相似度. 实验结果表明, 用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际, 更合理有效.  相似文献   

20.
介绍了数据聚类算法,提出了采用基于相似度的聚类算法进行客户分类的思路,给出了相似度的计算方法及客户分类的算法,并通过试验结果证明了算法对客户分类的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号