期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈志雨王慧君胡明刘钢《吉林大学学报(理学版)》2017,55(3):664-672

针对半监督聚类算法中监督信息使用不充分,监督信息中信息含有量低的问题,提出一种结合主动学习的半监督聚类算法.首先结合使用数据的类别标记和成对约束信息,指导Kmeans聚类过程,设计出一种基于Seeds集和成对约束的半监督聚类算法SC-Kmeans;其次将主动学习算法引入到SC-Kmeans中,以尽量小的代价选取信息含有量更高的监督信息,提高SC-Kmeans算法的聚类精度;最后在UCI标准数据集上进行仿真实验.实验结果表明,该算法取得了较好的聚类效果,有效提高了聚类准确率. 相似文献

2.

基于半监督学习的k平均聚类框架

陈新泉苏锦钿《广西大学学报(自然科学版)》2014,(5)

为克服k-means算法难以探测出一些局部分布稀疏不均、聚类区域的形状与大小不规整数据点集的聚类分布结构这个缺点,在半监督学习思想的指导下,针对混合属性空间区域中具有同一分布性质的带有类别标记的小样本数据集和无类别标记的大样本数据集,提出了一种基于半监督学习的k平均聚类框架。仿真实验表明：该框架经常能取得比k-means更好的聚类精度,从而说明这个半监督学习框架具有一定的有效性。相似文献

3.

基于条件互信息下聚类的朴素贝叶斯分类算法 总被引：1，自引：0，他引：1

彭兴媛刘琼荪王立威《云南大学学报(自然科学版)》2011,(5):517-520

采用条件互信息来度量任意2个条件属性之间的关联程度,采用互信息度量各条件属性与类属性间的关联程度,以此作为将各条件属性进行聚类的准则,提出一种新的将条件属性进行聚类的分组技术.同时,结合朴素贝叶斯分类算法,构造了改进的朴素贝叶斯分类模型.通过仿真实验表明该文提出的算法具有较好的分类性能. 相似文献

4.

基于成对约束的主动学习半监督聚类算法

蒋伟进许宇晖郭宏许宇胜王欣《应用基础与工程科学学报》2014,(6)

半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能. 相似文献

5.

一种鲁棒的半监督图聚类方法

《云南师范大学学报(自然科学版)》2021,(3)

考虑到l_1范数度量比l_2范数平方度量更鲁棒,基于l_1度量提出了一种更鲁棒的半监督图聚类模型,针对该模型中非光滑目标函数不易优化的问题,利用Majorization-Minimization框架提出了一种新的求解算法并证明了其收敛性.实验结果表明,在监督信息有噪声或错误时,所提出的模型能提高半监督聚类的鲁棒性和有效性. 相似文献

6.

基于半监督聚类的入侵检测模型

尹柯李雯睿《河南大学学报(自然科学版)》2008,38(6)

利用少量的标记数据和约束辅助聚类过程,提出一种基于半监督聚类的入侵检测模型.实验结果表明,与基于监督和非监督学习的入侵检测算法相比,基于半监督聚类的入侵检测算法可以更加有效地检测出未知攻击. 相似文献

7.

基于交叉熵测度的成对约束模糊核聚类算法

《应用科技》2020,(1)

目前已有的成对约束模糊核聚类研究中,缺乏对成对约束信息的有效测度,进而无法充分利用成对约束这类半监督信息。在成对约束核聚类的基础上,文中提出基于交叉熵测度的成对约束核聚类算法。利用对象交叉熵测度工具,提出最小-最大交叉熵隶属度学习准则,并作为成对约束信息测度项引入到成对约束核聚类的目标函数中,通过拉格朗日最优化处理目标函数,推导出相应聚类算法。实验进一步表明,该算法能够更有效利用成对约束半监督信息提升聚类性能。相似文献

8.

一种基于半监督降维的聚类算法 总被引：1，自引：1，他引：0

朱凤梅张道强《广西师范大学学报(自然科学版)》2008,26(3)

半监督聚类通过利用少量有标号样本或成对约束等监督信息来提高聚类性能.在此提出一种新颖的基于半监督降维的聚类算法,首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类.由于在降维和聚类两个阶段中都利用了监督信息,从而使得算法的聚类性能得到进一步提升.在UCI标准数据集、yale人脸库以及文本数据集上的实验结果验证了该算法的有效性. 相似文献

9.

基于局部结构保持的高维数据半监督深度嵌入聚类算法

下载免费PDF全文

曹超李梦利阳树洪李春贵《广西科学》2022,29(5):922-929

聚类是机器学习和数据挖掘中的重要课题。近年来,深度神经网络(Deep Neural Networks,DNN)在各种聚类任务中受到广泛关注。特别是半监督聚类,在大量无监督数据中仅引入少量先验信息即可显著提高聚类性能。然而,这些聚类方法忽略了定义的聚类损失可能破坏特征空间,从而导致非代表性的无意义特征。针对现有半监督深度聚类的特征学习过程中局部结构保持有所欠缺的问题,本文提出一种改进的半监督深度嵌入聚类(Improved Semi-supervised Deep Embedded Clustering,ISDEC)算法,采用欠完备自动编码器在特征表达学习的同时,保持数据的内在局部结构;通过综合聚类损失、成对约束损失和重构损失,对聚类标签分配和特征表达进行联合优化。在包括基因数据在内的若干高维数据集上的实验结果表明,本方法的聚类性能比现有方法更好。相似文献

10.

一种基于服务使用信息的Web服务QoS度量方法 总被引：1，自引：0，他引：1

刘国奇朱志良刘莹王琴《东北大学学报(自然科学版)》2009,30(10):1398-1401

针对现有的基于QoS的度量方法只考虑对Web service的公共属性的研究,忽略了领域属性,不具备通用性的问题,把QoS度量分为有约束和无约束两类,并分别提出QoS度量方法.对有约束的QoS度量,提出一个基于约束信息的度量方法;对于无约束QoS度量,给出一种通过对已有服务使用信息、自动调整QoS度量的指标及指标系数的方法.最后,介绍算法的实现平台及实验结果分析,并通过实验证明方法的可行性和有效性. 相似文献

11.

改进的FCM半监督聚类算法

郭新辰樊秀玲郗仙田韩啸《吉林大学学报(理学版)》2014,52(6):1293-1296

通过将类间分离度函数引入到模糊C-均值聚类算法中,结合半监督的思想,建立基于信息熵的半监督模糊C-均值聚类模型,并对该模型的求解过程进行推导,提出一种新的算法.为了验证算法的有效性,将该算法在UCI数据集上进行实验,实验结果表明,该算法比仅引入信息熵的模糊C-均值聚类方法聚类性能更好. 相似文献

12.

基于半监督ISHC层次描述的Mashup服务聚类

赵国栋周莹宋丽亚《吉林大学学报(理学版)》2015,53(4):698-704

针对传统Mashup服务推荐在网络构建方式的成本和计算复杂性过高问题, 提出一种基于半监督层次聚类描述的Mashup服务推荐算法. 首先, 利用网爬工具收集ProgrammableWeb上的Mashup服务信息, 并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式, 以此作为研究分析的数据集; 其次, 为提高聚类精度, 提出一种半监督层次描述聚类算法, 通过植入层次聚类算法顶层核心集方式, 有效解决了传统层次描述聚类因顶层分类集构造失败而影响Mashup服务推荐算法的准确度. 通过在聚类数据集和网爬Mashup服务数据库上的实验表明, 该算法的Mashup服务推荐准确率优于对比算法. 相似文献

13.

基于图形正则化低秩表示张量与亲和矩阵的多视图聚类

程学军王建平《吉林大学学报(理学版)》2022,60(3):671-684

针对聚类中忽略局部结构、低秩表示张量与亲和矩阵高度依赖性等问题, 提出一种基于图形正则化低秩表示张量与亲和矩阵的多视图聚类方法. 首先, 提出一个统一的框架学习多视图子空间的图正则低秩表示张量和亲和矩阵; 其次, 进一步通过基于张量核范数的张量奇异值分解分析高阶交叉视图关联性, 并利用图形正则化保留嵌入在高维空间中的局部结构; 最后, 利用约束二次规划为每个视图分配自适应权重. 在7个数据集上的实验结果证明了该方法聚类效果更好. 相似文献

14.

基于多模态共享网络的自监督语音-人脸跨模态关联学习方法

李俊屿卜凡亮谭林周禹辰毛璟仪《科学技术与工程》2024,24(7):2804-2812

现有的语音-人脸跨模态关联学习方法在语义关联和监督信息方面仍然面临挑战,尚未充分考虑语音与人脸之间的语义信息交互。为解决这些问题,提出一种基于多模态共享网络的自监督关联学习方法。首先,将语音和人脸模态的特征映射到单位球面,构建一个公共的特征空间;接着,通过多模态共享网络的残差块来挖掘复杂的非线性数据关系,并利用其中权重共享的全连接层来增强语音与人脸特征向量之间的关联性;最后,使用K均值聚类算法生成的伪标签作为监督信号来指导度量学习,从而完成4种跨模态关联学习任务。实验结果表明,本文提出的方法在语音-人脸跨模态验证、匹配和检索任务上均取得了良好的效果,多项评价指标相较于现有基线方法提升1%～4%的准确率。相似文献

15.

基于半监督的模糊C-均值聚类算法

郭新辰郗仙田樊秀玲韩啸《吉林大学学报(理学版)》2015,53(4):705-709

通过将半监督学习的思想引入到模糊C-均值聚类方法中,提出一种基于半监督的模糊C-均值聚类算法,有效解决了模糊C-均值聚类算法随机选取初始聚类中心导致聚类结果局部收敛的问题,能客观获取最佳聚类数目和初始聚类中心.实验结果表明,与传统模糊C-均值聚类算法相比,基于半监督的模糊C-均值算法在一定程度上减少了迭代次数,降低了对初始聚类中心的依赖性. 相似文献

16.

基于维基百科信息框的本体信息提取

陈刚徐星羽《吉林大学学报(理学版)》2020,58(2):355-363

针对传统方法在维基百科信息框中提取本体信息精准率较低的问题, 研究维基百科信息框中的属性结构化信息. 首先定义一组候选特征判定信息框属性之间的关系, 建立与类别、列表、文章及维基百科信息框模板之间的关联；然后借鉴本体匹配方法提取维基百科信息框结构化信息, 计算属性对的相似度, 设置边界限制条件, 在达到一定精确度下构建本体结构描述属性之间的关系, 并构建类层次结构. 结果表明, 所给方法解决了提取本体信息精准率较低的问题, 能高效、正确地在给定主题文章中将可能的属性结构提取出来, 并发现合理的类关系. 相似文献

17.

基于属性差异的产品缺陷数据关联规则模糊分类

下载免费PDF全文

李怡孔建益王兴东刘军伟《武汉科技大学学报》2017,40(1):49-54

针对工业生产过程中所产生的产品缺陷数据经过数据挖掘后关联规则存在不能有效组织的问题,提出一种基于项目属性差异的产品缺陷数据关联规则模糊分类方法,在建立模糊分类树的基础上,计算出关联规则间距离,并采用自组织神经网络聚类的方法对挖掘结果进行聚类分析。将该方法应用于冷轧带钢表面缺陷数据挖掘后处理,结果表明,该方法不仅能够得出两种不同属性项目间的关联性,还可以求出缺陷关联规则间的距离,距离越近的关联规则被聚为一类,其相似性越大。相似文献

18.

装备模拟训练系统数据离散化

邓青薛青杜楠付朝博《科学技术与工程》2021,21(27):11674-11680

离散化是装备模拟训练系统数据预处理的重要组成部分。针对传统数据离散化方法对单个属性依次处理,往往忽视属性间的相关性,造成装备模拟训练系统数据离散化后的误差。提出基于层次聚类和相容度的数据离散化方法。采用逐层泛化构建离散化总体框架,完成对装备模拟训练系统数据混合型决策表处理。设计动态确定簇数的层次聚类,实现对属性的初始整体划分;结合类别属性信息和相容度合并相邻区间,去除冗余的离散划分。实验结果表明,基于层次聚类和相容度的数据离散化方法在区间总数、精度方面有明显优势。相似文献

19.

大数据云存储下海量数据传输完整度控制技术

李炜《吉林大学学报(信息科学版)》2019,37(6):682-686

为确保大数据云存储下海量数据传输的完整度,提出了一种基于属性特征匹配和关联规则的海量数据传输完整度控制方法。构建海量数据的属性特征高维重组模型,得到关键信息的特征分布状况,据此设计海量数据的关键信息存储分布结构模型,采用关联规则方法进行海量数据的关键信息特征挖掘提取,利用关键信息进行海量数据的特征分析和数据聚类处理,采用属性特征匹配方法设计海量数据关键信息存储节点后,利用模糊减法聚类对关键信息存储节点进行聚类处理,在海量数据传输中,以数据关键信息存储节点传输的完整度实现海量数据的传输完整度控制。仿真结果表明,采用该方法进行海量数据传输完整度控制,能提高云存储下的空间利用效率,数据传输完整度高。相似文献