首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着科技飞速发展,越来越多科技术语涌入到人们日常词汇中。本文旨在探讨英汉科技术语语义泛化在两种语言中的具体表现形式以及其相似之处,以为词汇规范提供相应证据。  相似文献   

2.
基于免疫克隆选择算法的特征选择   总被引:12,自引:0,他引:12  
提出了一种基于免疫克隆选择算法的特征选择方法.特征选择可以被看成是一个组合优化问题,利用免疫克隆选择算法快速收敛于全局最优的特性,加快搜索到最优特征子集的速度,为后续模式分类提供良好的判别依据.实验结果表明算法在保持甚至提高分类精度的同时,有效地降低了特征维数.与基于遗传算法特征选择的结果相比较,在有限代数内,该算法能收敛到更优的特征子集,从而验证了算法的有效性及其应用潜力.  相似文献   

3.
多标记特征选择已被广泛应用于医疗诊断、模式识别等领域,然而现实中的数据往往存在维数灾难以及标记大量缺失等问题,现有的弱多标记特征选择算法又普遍易受缺失标记和噪声的干扰,使算法模型难以准确地选择重要特征.针对上述问题,提出一种用于弱多标记数据集特征选择的弱监督对比学习方法,旨在缺失和含噪声标记数据集中选择优质特征,同时挖掘少量人工标注数据中潜在的类间对比模式.该方法包括三个步骤:首先,设计一种弱监督预训练策略,通过利用实例相似性以及稀疏学习方法获取每个类标记类属属性,用于恢复缺失标记;其次,引入对比学习策略来捕获少量有标记数据的对比模式来削弱噪声数据的影响;最后,选取10组多标记数据集以及四个评价指标进行实验.实验结果证明,与多个先进多标记特征选择算法相比,提出的方法分类性能更优.  相似文献   

4.
传统的Relief-F算法主要用于处理有标记数据集.针对部分标记数据集,引入一种基于耦合学习的数据样本相似度,设计了一种面向符号数据的基于Relief-F算法的半监督特征选择算法.为有效验证新算法的可行性,实验分析中选取了5组UCI数据集和3种常用机器学习分类器来进行验证,实验结果进一步验证了算法的有效性.  相似文献   

5.
根据科技文献的结构特点搭建了一个四层挖掘模式,并结合K-medoids算法提出了一个特征选择方法.该选择方法首先依据科技文献的结构将其分为4个层次,然后通过K-medoids算法聚类对前3层逐层实现特征词提取,紧接着再使用Aprori算法找出4层的最大频繁项集,并作为4层的特征词集合.同时,由于K-medoids算法的精度受初始中心点影响较大,为了改善该算法在特征选择中的效果,论文又对K-medoids算法的初始中心点选择进行优化.实验结果表明,结合优化K-medoids的四层挖掘模式在科技文献分类方面有较高的准确率.  相似文献   

6.
区分能力和泛化能力是分类算法极其重要的两个方面。区分能力是指分类器很好的将不同类的样本区分开来。泛化能力是指从训练样本数据得到的模型也能够很好的适应测试样本数据。本文简要介绍目前的各种分类算法,并从这两个方面对各个分类器进行了比较。  相似文献   

7.
王帆  赵春晖  张志 《应用科技》2009,36(3):11-14
针对经典PCA算法在人脸特征提取上的局限性,提出了一种基于克隆选择算法的特征选择方法.克隆选择算法的收敛速度快,具有较强的全局搜索能力,可以快速搜索到最有利于分类的特征空间;因此利用克隆选择算法对PCA变换后的特征向量进行选择,可以有效避免PCA只选择人脸轮廓信息,而忽略细节信息的不足,在人脸识别中取得了较好的效果.通过对ORL和Yale人脸库的仿真实验表明,该方法无论在识别率、降维效果还是稳定性方面,性能均优于遗传算法,不但有效降低了特征向量维数,还将人脸识别率提高到91.5%,因此研究该算法具有很强的现实意义.  相似文献   

8.
徐明  龙文 《科学技术与工程》2021,21(20):8544-8551
针对基本灰狼优化算法(grey wolf optimizer,GWO)在求解复杂优化问题时存在解精度低、探索与开发能力不平衡、收敛速度慢和易陷入局部最优的缺点,提出一种基于多策略融合的改进灰狼优化算法.首先,设计一种基于正弦函数的非线性过渡参数策略替代原灰狼优化算法中的线性递减策略,以实现算法从勘探到开发的良好过渡;其次,利用个体自身历史最佳位置和决策层个体共同引导群体进行搜索,以加速算法收敛速度和提高寻优精度;然后,在当前最优灰狼个体上引入小孔成像学习策略产生新的候选个体,以降低算法陷入局部最优的概率.选取6个基准测试函数进行数值实验.结果 表明:改进算法在求解精度和收敛速度指标上均优于其他比较算法.最后,将改进算法用于求解特征选择问题,对10个基准数据集的仿真结果表明,改进算法能有效地提高分类精度和选择最优特征.  相似文献   

9.
针对传统邻域选择方法不能根据流形样本密度和弯曲度合理选择邻域的缺点,提出了一种有序自适应的邻域选择算法.该算法从流形上曲率最小的点开始,以宽度优先的次序不断地处理每个点.对搜索到的数据点,基于流形结构的局部线性特性,利用已有的邻域信息估算其局部切空间,然后通过其邻域边在切空间的投影自适应地选择合适的邻域.实验结果表明:该算法应用于Isomap后,对不同结构的数据集嵌入结果更准确.  相似文献   

10.
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集.这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题.为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighbor...  相似文献   

11.
在工业场景中,因为设备异常现象的罕见性和高度多样化,以及机器的操作条件或环境噪声在训练和测试阶段的不同,会改变训练和测试数据之间的声学特性。为解决上述问题,提出一种基于联合深度学习和变分贝叶斯高斯混合模型的无监督异常声音检测算法。通过两种神经网络联合训练进行信息提取,并利用变分贝叶斯高斯混合模型对其所获得的嵌入进行聚类分析;引入一种新的混合示例数据增强方法,用多种方式相结合的替代方法来生成示例,以对齐不同域之间的分布;应用了一种改进的子集群AdaCos损失函数,以排除潜在的异常值。实验结果表明,该方法在三种工业机器类型的数据集上目标域的平均曲线下面积达到了79.03%,平均F1分数达到了67.23%;对比基线模型,谐波平均值提升约20%,在工业设备无监督异常声音检测中表现良好。  相似文献   

12.
基于特征选择的神经网络集成方法   总被引:5,自引:0,他引:5  
将特征选择技术ReliefF引入Bagging方法中,提出了一种新的神经网络集成方法——ReBag.实验结果表明,本方法的泛化能力优于Bagging方法,与Attribute Bagging方法相当但效率更高.  相似文献   

13.
孙俏  凌卫新 《科学技术与工程》2020,20(20):8245-8251
现有迁移学习研究大多数都建立在源领域和目标领域的相似度较高的全局约束下,对如何选择合适的源领域缺乏研究。为了确定如何自适应地从候选源领域集合中选择合适源领域,提升迁移效率,避免"负迁移"现象,基于最大均值差异(maximum mean discrepancy,MMD)提出一种叫作域间相似度序数(MMD-SR)的度量方法,用于度量候选源领域与目标领域间的相似度。同时,基于MMD-SR,提出一种迁移学习源域自适应选择策略(MMD-SR source domain selection strategy,MMD-SR_SDSS)。在人工数据集和真实数据集中的实验结果表明了度量方法MMD-SR和源领域选择策略MMD-SR_SDSS的有效性和可行性。  相似文献   

14.
由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决。为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择。该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文档进行文本特征初选以过滤低频的噪声词,然后再使用所给的基于论域划分的属性约简进行文本特征优选。实验结果表明这个方法能够克服文本聚类时缺乏类的先验知识的不足,可以较好地解决无监督文本特征选择问题。  相似文献   

15.
乳腺肿块检测是防治乳腺癌的有效途径,基于乳腺X射线图像特征模型的极限学习机(ELM)分类算法已被应用于计算机辅助检测乳腺肿块中.针对由于特征间的依赖性导致的ELM学习效率和检测准确度低的问题,提出了基于特征选择ELM的乳腺肿块检测算法.利用影响值选择、序列前向选择和遗传选择等方法进行特征选择,进而利用该结果提高ELM的性能.通过490例来自辽宁省肿瘤医院的乳腺X射线图像的实验表明,基于特征选择ELM的乳腺肿块检测算法能有效提升乳腺肿块检测的效果,其中以遗传选择对ELM性能提升最明显.  相似文献   

16.
集成学习中特征选择技术   总被引:1,自引:0,他引:1  
集成学习和特征选择是当前机器学习领域中的研究热点.集成学习通过重复采样可产生个体学习器之间差异度,从而提高个体学习器的泛化能力,特征选择应用到集成学习可进一步提高集成学习技术的效果,该研究有3个方面:数据子集的特征选择、个体学习器的选择和多任务学习.该文对近几年集成学习中特征选择技术的研究进行回顾,尤其对以上3个方面的研究分别进行总结,提出一些共性的技术指导以后的研究.  相似文献   

17.
因能有效地压缩卷积神经网络模型,知识蒸馏在深度学习领域备受关注。然而,经典知识蒸馏算法在进行知识迁移时,只利用了单个样本的信息,忽略了样本间关系的重要性,算法性能欠佳。为了提高知识蒸馏算法知识迁移的效率和性能,文中提出了一种基于特征空间嵌入的对比知识蒸馏(FSECD)算法。该算法采用批次内构建策略,将学生模型的输出特征嵌入到教师模型特征空间中,使得每个学生模型的输出特征和教师模型输出的N个特征构成N个对比对。每个对比对中,教师模型的输出特征是已优化、固定的,学生模型的输出特征是待优化、可调优的。在训练过程中,FSECD缩小正对比对的距离并扩大负对比对的距离,使得学生模型可感知并学习教师模型输出特征的样本间关系,进而实现教师模型知识向学生模型的迁移。在CIFAR-100和ImageNet数据集上对不同师生网络架构进行的实验结果表明,与其他主流蒸馏算法相比,FSECD算法在不需要额外的网络结构和数据的情况下,显著提升了性能,进一步证明了样本间关系在知识蒸馏中的重要性。  相似文献   

18.
特征选择方法中的信号分析方法研究   总被引:4,自引:1,他引:3  
特征选择是模式识别领域中最重要的环节,也是最根本的论题。论文从随机信号的傅立叶分析中自相关函数与谱密度函数之间的对应关系出发,提出了一种基于自相关函数的特征选择方法,并以实验方式进行了有效性验证。其研究意义还在于将这一特征选择方法与人工智能中的归纳学习方法相结合,其归纳性能比传统的熵最小化准则更为优越。  相似文献   

19.
基于路径和基于知识表示的推理是当前知识图谱领域两大主流推理方法,二者的融合算法可以提高知识推理的准确率,但是依旧存在表示学习的时候效率低下、预测准确率低、模型过拟合等若干问题.本文方法针对这些问题提出了基于路径选择的表示学习方法.对路径特征信息进行进一步的过滤和筛选,保留关键路径,在路径信息和知识表示的结合过程中使用平衡参数对缺失路径信息的三元组进行处理.使用公开数据集对模型进行测试,实验表明模型可以有效提高泛化能力和准确率.  相似文献   

20.
一种基于特征选择的入侵检测方法   总被引:1,自引:0,他引:1  
针对入侵检测中网络数据高维度、 大规模所带来的问题, 基于特征选择方法Fisher在网络安全数据集中的应用, 提出一种基于特征选择的通用入侵检测框架. 该方法通过提取关键特征, 降低安全数据的维度; 采用K近邻方法作为分类器, 验证特征选择后的检测效果. 实验结果表明, 该方法能在较少特征的情况下达到较高的检测率, 具有较好的可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号