首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 625 毫秒
1.
一种采用LLE降维和贝叶斯分类的多类标学习算法   总被引:2,自引:0,他引:2  
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。  相似文献   

2.
在单类支持向量数据描述算法的基础上, 提出了一种基于局部支持向量数据描述的稀有类分析算法: LSVDD, 能够处理存在类重叠的类不平衡问题. 该算法利用支持向量数据描述算法对各类样本分别进行单类学习, 从而获得单类模型; 然后对单类模型的概念重叠区域使用属性选择进一步进行局部单类学习, 最后得到综合分类模型. 在仿真数据集和UCI数据集上的实验结果表明, LSVDD能够有效和稳定地提高稀有类分析精度.  相似文献   

3.
针对作战仿真实验中体系效能通常依靠专家评估、评估代价较大的问题, 提出一种基于预聚类主动半监督学习的作战体系效能评估方法。明确了使用该方法进行作战体系效能评估的基本流程, 以及自顶向下的评估模式和二值化的评估标准。重点构建了预聚类主动半监督学习算法, 首先, 结合作战仿真实验数据的特点, 对未评估样本进行预聚类, 选择最有价值的样本供专家标注; 然后, 使用已标注的样本训练主动学习算法和半监督学习算法的公用学习器; 最后, 利用主动学习算法挑选价值较高的样本交由专家评估, 并利用新样本对学习器进行不断更新。作战仿真实验数据表明, 该方法在达到预期评估准确度的同时降低了评估代价, 能有效应用于大规模作战仿真实验的体系效能评估。  相似文献   

4.
信息技术的快速发展导致了数据规模的爆炸式增长,传统的机器学习、数据挖掘算法面临新的 挑战. 流形学习克服了传统线性降维算法的不足,成为十年来降维研究的热点领域. 然而流形学习 算法复杂度高,对于大规模的数据集并不适用. 针对大规模数据集下的流形学习降维问题,提出了 基于MapReduce 的分布式流形学习算法. 该算法采用局部敏感哈希函数将相似点映射到同一个桶中,利用流形具有局部欧氏同胚的性质,在每个桶内采用欧氏距离度量点之间的测地距离,桶之间采用 中心点及边缘点来计算修正的测地距离. 在大规模的人工合成数据集和真实数据集上的实验表明,该算法能有效地估计数据点间的测地距离,适用于处理大规模数据集的降维问题.  相似文献   

5.
一种基于自组织特征映射网络的聚类方法   总被引:7,自引:0,他引:7  
针对传统聚类算法不能有效地处理大数据集和高维数据集的问题,提出了一种基于自组织特征映射网络的聚类方法。该方法能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变,而且无需监督,能自动对输入模式进行聚类。给出了应用该方法的具体步骤和加速自组织过程的若干改进方法,通过仿真实验证明该算法的有效性。  相似文献   

6.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.  相似文献   

7.
为提高支持向量机(support vector machine, SVM)算法对大规模数据的适应能力,加快SVM算法的分类速度,提出一种基于决策树的快速SVM分类方法。该方法的重点在于构建一棵决策树,将大规模问题分解为相对简单的子问题,树中节点由线性支持向量机组成,每个节点包含一个决策超平面,分类过程取决于节点的数量。此方法在分类复杂样本时避免了使用非线性核函数。并且由于使用线性核函数,则不用进行模型选择,进一步加快了样本的分类速度。实验表明,针对大规模多特征数据的非线性分类问题,该方法比传统方法具有更高的速度。  相似文献   

8.
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上采用抽样后剩余数据样本对质心的初始位置进行更新,以便校正偏离理想位置的初始质心。该划分聚类算法具有线性空间复杂度和时间复杂度。实验结果表明所提的新聚类算法不仅能得到比常用聚类算法更理想的结果,而且运行速度快,适合处理大规模数据的聚类任务。  相似文献   

9.
为提高支持向量机在大规模数据集上的训练效率,提出一种基于自适应协同聚类的支持向量预选算法。该方法通过对两类样本进行自适应协同聚类,寻找少量具有协同关系的类中心对,替代支持向量进行训练,从而减少参训样本数量。其中,中心对数量由算法自动确定。与其他支持向量预选算法的对比实验结果表明,自适应协同聚类算法能够在不影响分类性能的情况下,有效提高训练速度,是一种行之有效的快速支持向量预选算法。  相似文献   

10.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。  相似文献   

11.
针对支持向量机(souport vector machine,SVM)训练学习过程中样本分布不均衡、难以获得大量带有类标注样本的问题,提出一种基于委员会投票选择(query by committee,QBC)的SVM主动学习算法QBC-ASVM,将改进的QBC主动学习方法与加权SVM方法有机地结合应用于SVM训练学习中,通过改进的QBC主动学习,主动选择那些对当前SVM分类器最有价值的样本进行标注,在SVM主动学习中应用改进的加权SVM,减少了样本分布不均衡对SVM主动学习性能的影响,实验结果表明在保证不影响分类精度的情况下,所提出的算法需要标记的样本数量大大少于随机采样法需要标记的样本数量,降低了学习的样本标记代价,提高了SVM泛化性能而且训练速度同样有所提高。  相似文献   

12.
基于变精度粗糙集的分类决策树构造方法   总被引:4,自引:0,他引:4  
针对分类决策树构造时最优属性选择困难、难以适合大规模数据集的问题,提出新的属性选择标准--属性分类重要性测度,引入王信度和支持度,设计了基于变精度粗集理论的决策树算法.分类重要性测度可全面刻画属性的综合分类能力,且计算比信息增益简单.决策树生长过程中引入支持度和置信度,以控制决策树的生长,提高决策树对噪声数据集和不相容数据集的处理能力,减小决策树的规模.通过对UCI上5个不同规模和类型的数据集进行测试计算,结果表明算法效率高于ID3算法,与UCI报告的最好结果相当.  相似文献   

13.
基于决策类分割的动态数据环境下的归纳学习   总被引:1,自引:0,他引:1  
程玉胜  张佑生  胡学钢 《系统仿真学报》2007,19(12):2864-2867,2871
深入分析了基于分辨矩阵和传统决策矩阵的归纳学习算法中存在的问题,提出了一种新的决策矩阵及基于它的归纳学习和动态数据环境下的递增式学习方法.其主要思想是基于决策类将决策系统分割为多个子系统,并构造其新的决策矩阵,然后将决策系统上的归纳学习转化为新决策矩阵下的递增式学习.这不仅解决了动态数据环境下归纳学习问题,而且能降低矩阵空间规模,避免了传统决策矩阵算法中的重复计算.实例分析和实验结果验证了基于分治策略算法的合理性和有效性.  相似文献   

14.
基于相异度核空间的支持向量机算法   总被引:1,自引:0,他引:1  
提出基于相异度核空间的混合流形学习与支持向量机(SVMs)算法用于解决高维数据分类问题. 该算法使用SVMs对流形学习降维后的低维嵌入做分类.通过加常数方法构造了衡量数据点相异度的特征空间. 证明了该特征空间不仅能够衡量数据点之间的相异度,还满足Mercer条件对于支持向量机分类核空间的半正定性的要求. 在仿真实验中,采用UCI机器学习数据库上标准分类数据集为样本. 对比构造的相异度核空间与常用核函数如线性核、多项式核、高斯核在支持向量机分类时的 分类精度来验证有效性和优越性.  相似文献   

15.
为满足现役装备根据故障样本数据集积累的特点进行自适应故障诊断的需求, 本文将极限学习机(extreme learning machine, ELM) 的数据增量学习、隐藏层增量学习和输出层增量学习(类增量学习)3种增量学习模式, 融合到一个统一的学习框架内, 提出一种凸最优自适应增量在线顺序ELM(convex optimal adaptive incremental online sequential ELM, COAIOS-ELM)。模型能够根据增量学习中误差的变化情况, 自适应地增加隐藏层神经元, 减小分类误差; 并可根据增量数据集中新出现的故障类别, 进行相应的类增量学习, 增加故障诊断的范围。有效解决了ELM增量学习过程中模型自适应动态选择最佳网络结构的问题, 提高模型的故障诊断的精度和故障诊断的范围。本文选择UCI数据集中公共数据集和Biquad低通滤波电路故障诊断数据集, 通过与类增量ELM (class incremental ELM, CI-ELM)模型对比实验, 验证了所提方法的有效性。  相似文献   

16.
针对基于机器学习的本体映射方法存在的人工标记代价高和样本不平衡问题,将本体映射建模为二视图上的协同训练问题,分别从本体模式层和数据层提取特征集。通过对本体概念对进行预匹配,缩小样本不平衡度。分析了传统协同训练方法的局限性,结合主动学习思想,设计了一种考虑样本价值的改进协同训练算法,在每轮迭代中选择更有价值的未标记样本更新训练集。实验结果表明,该方法学习效率更高,同时能取得较好的本体映射结果。  相似文献   

17.
针对贝叶斯网络判别学习方法在处理大数据集时,存在的模型训练时间长、算法迭代次数过多等问题,通过引入指数级参数,提出了混沌量子粒子群的权重类条件贝叶斯网络参数学习方法。该方法首先通过优化对数似然函数,解决生成学习的参数估计问题。然后,使用生成学习的结果,初始化判别学习的参数。最后,引入混沌映射序列,通过混沌量子粒子群优化(chaos quantum particle swarm optimization, CQPSO)算法,优化条件对数似然函数。使用权重类条件贝叶斯网络分类器对液体火箭发动机的故障进行分类,仿真结果表明,改进的方法分类精度高,误分类率低。同时,采用CQPSO与量子粒子群优化(quantum particle swarm optimization, QPSO)算法、标准粒子群优化(particle swarm optimization, PSO)算法相比,能够有效减少算法的迭代次数,提高算法的效率。  相似文献   

18.
基于活跃集迭代法的支持向量机快速增量学习算法   总被引:2,自引:0,他引:2  
陶亮 《系统仿真学报》2006,18(11):3305-3308,3312
介绍了一种新的支持向量机(SVM),其优化问题的对偶问题为具有简单界约束的凸二次规划问题:探讨了将活跃集迭代法运用于这种SVM的学习算法以及初始活跃集的选取问题;针对增量学习和大规模学习问题,提出了基于活跃集迭代法的SVM快速增量学习算法;实验验证了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号