共查询到18条相似文献,搜索用时 91 毫秒
1.
基于属性相关性分析的子空间搜索算法 总被引:1,自引:0,他引:1
在高维子空间聚类算法中,子空间识别质量有助于改善算法性能.提出了基于属性相关性分析的子空间搜索算法,利用相对熵去除冗余属性,根据联合基尼值判断两两非冗余属性之间的相关性,形成属性关系图,并在此属性关系图上搜索相似兴趣子空间.实验结果表明算法参数容易设置,有较好的子空间识别能力. 相似文献
2.
在高维子空间聚类算法中,子空间识别质量有助于改善算法性能。提出了基于属性相关性分析的子空间搜索算法,利用相对熵去除冗余属性,根据联合基尼值判断两两非冗余属性之间的相关性,形成属性关系图,并在此属性关系图上搜索相似兴趣子空间。实验结果表明算法参数容易设置,有较好的子空间识别能力。 相似文献
3.
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低。讨论了利用MapReduce对这类数据集进行并行聚类的方法,提出了基于MapReduce的抽样-忽略子空间聚类算法(sample-ignore subspace clustering using MapReduce,SISCMR)。该算法将串行聚类算法用作插件,具有很好的通用性。在人造和真实数据集上进行了大量实验,其中最大为0.2 TB的数据集在128个核心的集群中仅用不到10 min就完成了聚类,验证了该算法良好的聚类质量、近线性的可扩展性和高效的聚类性能,证明了基于MapReduce的并行聚类的可行性。 相似文献
4.
提出一种新颖的多视图子空间聚类算法,不再对包含各种噪声以及冗余信息的原始数据进行特征融合,而是通过对不同视图的低维子空间表示进行融合,得到一个公共的低维子空间表示.将这个子空间表示作为相似度矩阵进行谱聚类,以得到更优的聚类效果.在3个广泛使用的多视图基准数据集上进行了实验,实验结果证明了所提出算法的有效性. 相似文献
5.
在现有的稀疏子空间聚类算法基础上提出了一个改进的稀疏子空间聚类算法。首先,利用高维数据可以通过同一子空间的低维数据稀疏地表示这一理论,建立一个稀疏最优化模型,获得稀疏矩阵。然后把稀疏矩阵应用到一个正则化谱聚类算法中,从而有效地把数据聚类到子空间中。最后,该算法应用到一个视频序列中,对每个视频帧里的运动物体进行识别,并与现有的子空间聚类算法相比较。实验结果表明,该算法能够有效地识别运动物体,具有良好的实时性和有效性。 相似文献
6.
现实中有很多样本数据是二维的,且多数聚类方法需将二维样本数据向量化,从而导致二维数据的内部几何信息丢失.针对这一问题,提出二维最小二乘回归子空间分割方法直接对二维数据进行聚类,将一维最小二乘回归子空间分割方法推广到二维,使得原始数据的结构信息得以保留.在人脸数据集和哥伦比亚大学图像数据集上进行实验,结果表明该方法是有效的. 相似文献
7.
稀疏子空间聚类是处理高维数据聚类的有效途径,而相似度矩阵的构造是稀疏子空间聚类的关键一步。文章引入子空间追踪算法来构造相似度矩阵,并由此给出了保证特征选择和特征再选择的充分条件。数值实验表明,子空间追踪算法所选择的原子相比经典的正交匹配追踪算法,其选择的原子更具代表性,精确特征选择率更高,聚类误差也得到了保留甚至更低。 相似文献
8.
本文首次引进相对隶属度,相对Fuzzy集、相对Fuzzy点和相关子空间的概念,讨论了相对运算的基本性质;证明了相对Fuzzy集族I^XA是完全分配格,以及相关算子f是从I^X到I^XA的满广义序同态;引进并考察了非退化相对Fuzzy点,证明了非退化相对Fuzzy点之集MA恰是I^XA的所有非零U-既约元之集,从而I^XA(MA)=I^XA是以MA为分子集的分子格。 相似文献
9.
子空间聚类能有效的发现各簇与所属于的子空间的联系,同时减少高维数据中因为数据冗余和不相关属性对聚类过程产生的干扰.已有的子空间聚类方法强调各子空间中簇的发现,往往忽略子空间的划分.提出了基于属性最大间隔的子空间聚类,该方法主要思想是对子空间的划分时信息的丢失达到最小,从而子空间聚类的结果的效果比较好.主要工作包括:第一,建立了子空间划分的目标函数,也就是使各划分的子空间相互依赖达到最小,第二,设计了基于属性最大间隔的子空间聚类算法Maximum Margin Subspace Clustering(MMSC)进行子空间聚类集成.最后,采用UCI和NIPS2013比赛等数据来做实验,结果表明,在大多数数据上MMSC算法比其他子空间算法能得到更好的聚类结果. 相似文献
10.
黎延海 《渝州大学学报(自然科学版)》2014,(1):53-55,60
通过对现有灰关联度模型的研究,依据数据序列时点间相对斜率差来计算关联系数,并基于离差最大化和最大熵原理,计算了各指标关联系数的权重,建立了改进的灰关联度模型;实例验证,方法所得分析结果与定性分析相一致,分辨效果更好,具有较高的可靠性和应用性. 相似文献
11.
为了提高现有推荐算法的准确性,提出一种基于条件相对平均熵的个性化推荐算法.首先,采用加权的CNM算法构建复杂网络,挖掘该网络的社团结构,作为商品待推荐域;其次,利用条件互信息和条件相对平均熵生成有效的节点次序,以提升贝叶斯网络构建的准确性;然后采用K2算法学习贝叶斯网络,分析出用户的消费性格,并判断待推荐域中商品与消费性格的联系,向用户提供感兴趣和合理的推荐;最后,基于电信运营商的实际数据进行实证分析,验证了该算法的有效性. 相似文献
12.
模糊相对熵及在模式识别中的应用 总被引:1,自引:0,他引:1
目的研究模糊相对熵在模式识别中的应用。方法利用模糊相对熵的一个修正公式——加权模糊相对熵研究模糊相对熵在模糊模式识别中的应用。结果数值例子说明模糊相对熵方法和最大最小贴近度方法得出了一致的模糊识别的结果。结论模糊相对熵方法用于模式识别是很有实际意义的。 相似文献
13.
一种改进的模糊聚类算法 总被引:10,自引:0,他引:10
针对现有聚类算法在参数输入、停机条件等方面存在诸多人为控制因素的问题,采用信息熵理论使聚类标准客观化,同时结合模糊聚类的思想,以隶属度作为信息熵计算的基础,并采用谱系的方法确定聚类数目,从而改进模糊聚类算法.研究表明,提出的基于信息熵的算法能够比较客观、科学地反映实际聚类情况. 相似文献
14.
15.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题. 相似文献
16.
WANGYihua WANGBaohan LIUYun CHENWeizu WANGCunxin 《科学通报(英文版)》2004,49(5):426-431
In the present study, we have developed the method brought forward recently for protein design based on the relative entropy. The new approach can be used in more common situation other than the special limits in the anterior method. The results indicate that our generalized method has increased the prediction precision for protein sequence and will be in favor of the study for protein design. 相似文献
17.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。 相似文献
18.
基于模糊聚类和信息熵的综合评价算法 总被引:2,自引:0,他引:2
针对目前综合评价技术存在的主旨不相协调、忽略了简洁性与有效性问题,在分析已有算法的基础上,提出了一种基于模糊聚类和信息熵的综合评价算法,该算法有针对性地克服了原有评价算法的缺陷,具有较好的实用性,最后通过实际数据对该算法的有效性进行了验证. 相似文献