期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《华中科技大学学报(自然科学版)》2016,(1):36-40

针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度. 相似文献

2.

一种基于邻域关系和模糊决策的特征选择方法

温欣李德玉王素格《南京大学学报(自然科学版)》2018,(4)

数据特征空间的高维性使得学习过程耗费了相对较多的时间,而且可能影响分类性能.邻域粗糙集模型可以用来解决特征选择问题,但该模型未能描述现实存在的样本的模糊性,可能导致信息的丢失.因此,建立了一种新的单标记特征选择模型,采用两种不同的隶属度计算方法获得样本对等价类的模糊隶属度,将每个等价类中最小隶属度值作为隶属度阈值.然后利用邻域样本隶属度与阈值的关系重新定义邻域粗糙上、下近似,进而通过衡量决策属性对特征子集依赖度的大小进行特征选择.在七个公开的UCI数据集上进行了实验,实验结果表明,与已有的几种特征选择方法相对比,分类准确度得到了进一步提高,选择的特征数目明显减少. 相似文献

3.

决策依赖聚类的高维数据特征选择

邓廷权辛丽颖《西南师范大学学报(自然科学版)》2022,(3):16-25

针对启发式特征选择和特征聚类驱动特征选择方法的不足,研究了决策依赖的特征冗余性问题,提出了一种基于邻域粗糙集的决策依赖特征聚类的高维数据特征选择方法(RDCFS).首先,依据邻域粗糙集模型,设计了一种特征联合依赖度增益度量,刻画数据特征在分类和辨识层面上的冗余性和关联性.其次,构建了一种最优特征簇结构的评估准则和特征冗... 相似文献

4.

一种改进的模糊支持向量机隶属度确定方法

刘成忠韩虎黄高宝《四川大学学报(自然科学版)》2011,48(3):546-550

为了克服支持向量机方法对于噪声或异常样本敏感的问题,本文研究基于粗糙集理论的粗糙单类支持向量机,提出一种改进的模糊支持向量机隶属度确定方法.该算法首先利用粗糙集思想构造一个最小粗糙球,分别得到对应粗糙球的上近似、下近似与边界区域,然后依据样本在超球中的位置对分布在下近似、边界域和粗糙球以外的样本,分别采用三种不同的方式... 相似文献

5.

基于K-S检验和邻域粗糙集的特征选择方法

刘艳程璐孙林《河南师范大学学报(自然科学版)》2019,47(2):21-28

传统的肿瘤基因选择算法挑选出的特征基因中存在大量噪声基因和冗余基因,从而对基因算法的准确性和分类精度产生影响.针对这一问题,将K-S检验与邻域粗糙集融合成为一种新的特征选择方法.首先,采用累积分布函数计算正负类样本的累积函数值和K-S检验统计量,对照显著性水平下的样本统计量,从而去除冗余基因和噪声基因;然后,使用邻域粗糙集进行约简,对比条件属性重要度得出最优约简结果;最后,对比K-S检验和两种基于K-S检验的特征选择方法得到的冗余度和分类精度,通过实验验证这种方法不仅能准确挑选出具有显著区分能力的肿瘤基因,且效率高具有可行性. 相似文献

6.

一种改进的数据挖掘模糊支持向量机分类算法

《兰州理工大学学报》2017,(5)

针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度及分类速度慢的缺点,提出一种改进的数据挖掘模糊支持向量机分类算法.该算法首先预选有效的候选支持向量缩减训练样本集的规模提高训练速度;其次提出一种新的模糊隶属度函数,增强支持向量对构建模糊支持向量机最优分类超平面的作用,并用经过预选的训练样本集进行训练FSVM得到支持向量集;最后,运用粒子群优化算法选择最优支持向量子集,使用平均分类误差作为适应度函数,最终粒子输出时,将样本隶属度与设定阈值相比较,选择出支持向量集中相对较大隶属度的样本作为新的支持向量,提高分类速度.实验结果表明,该算法在不损失分类精度的情况下,提高了模糊支持向量机的训练速度和分类速度. 相似文献

7.

基于两步特征加权的模糊支持向量机算法

鞠哲宋一明《大连理工大学学报》2023,(4):427-432

提出一种基于两步特征加权的模糊支持向量机算法.首先，利用信息增益算法获取样本的特征权重.然后，计算最大权重的特征与其他特征间的斯皮尔曼相关系数，并将二者相乘后再与原有的特征权重相加，得到新的特征权重，减少弱相关和不相关特征对分类造成的影响.最后，在设计样本模糊隶属度时，不仅考虑样本与类中心的距离，还引入了样本间的亲和度，并将二者进行融合，以此减弱样本分布不均对分类精度的影响.在UCI数据集上的实验表明，与现有流行的几种模糊支持向量机算法相比，所提算法在准确率和F₁值上得到了提升. 相似文献

8.

信息熵多属性约简的煤粉尘图像特性机理

王征汪梅《西安科技大学学报》2019,(4)

为研究无明确特征模式的煤尘颗粒图像特性,以某煤矿煤样为研究对象,按国标标准运用粉尘采样器对粉尘溢散源处颗粒物进行多点采样。采用多决策属性约简模糊粗糙集3个阶段即提出隶属度模型、实现属性约简、确定最大信息熵阈值分割对颗粒形态特征机理进行分析。首先建立粉尘图像各像素点对应的模糊类别隶属度模型,利用多分段函数确定隶属度;分析煤粉尘图像灰度特征并将其作为条件属性,确定条件属性的模糊依赖度,获取最优值并提取模糊属性约简,进行目标及背景区域的模糊下近似和模糊上近似划分;最后建立煤粉尘颗粒的信息熵模型,存储信息熵并实现对分割阈值的提取。结果表明:依据模糊属性约简的互异重要度可实现多属性约简;并确定煤粉尘图像模块区域的最大信息熵分割阈值。所建立模型可删除冗余属性,选择出对分类更为重要的属性,并通过属性约简完成特征选择分类。相似文献

9.

基于对应分析的冗余模糊C均值聚类算法研究

曾山同小军桑农李蓉烨《华中科技大学学报(自然科学版)》2012,40(2):107-111,132

针对模糊C均值聚类（FCM）算法聚类原型最适合于球状类型簇的特点,提出了基于类间分离度和类内紧缩度加权的冗余聚类中心的FCM算法,即先将大簇或者延伸形状的簇（非凸）采用加权FCM算法分割成多个小类（冗余类）,从而规避FCM算法对初始聚类中心敏感的弱点．由于隶属度划分矩阵的元素是每个样本隶属于各冗余类的隶属度值,因此将其作为各冗余类的类特征,通过对应分析得到冗余类的新特征,再次采用加权FCM算法进行冗余类合并,最后达到分类效果．以代表曲线分割和曲面分割分类问题的3个典型数据集为算例,结果表明该方法能够识别不规则的簇,解决了FCM算法对初始聚类中心敏感的缺陷．相似文献

10.

一种基于黏液菌觅食机制的特征选择算法及其在文本情感识别中的应用

《南京理工大学学报(自然科学版)》2021,45(5)

黏液菌(Physarum polycephalum)由于其展现出的迷宫寻径、路径寻优甚至构建与人工设计媲美的复杂交通网络等特殊能力而备受关注。该文正是受启发于黏液菌构建复杂鲁棒网络的行为,提出了一种仿生特征选择算法Slime-FS。Slime-FS将特征选择转化成一类最优特征子图求解问题,同时模仿黏液菌觅食机制,结合粗糙集理论构建了一种策略来指导最优特征子图的搜索。算法被应用于文本情感识别问题中,在某慕课平台评论文本数据集上进行了测试,结果显示Slime-FS能有效地选择鉴别特征,去除冗余和无关特征,其表现要远远优于基准算法(不带选特征选择的SVC),也要优于若干结合了元启发搜索策略的混合算法(Sklearn-genetic、EWGA、MSPSO和ACO)。相似文献

11.

图片型垃圾邮件过滤分析系统设计和实现

王潇杨陈南飞张登科王兴伟《大连理工大学学报》2011,51(Z1):69-72

从垃圾邮件图片的基本特性入手,选取图片的简单属性作为过滤特征对图片型垃圾邮件进行过滤.同时提出边缘灰度点比特征来提高过滤效率,该特征反映了图片中文字信息量的大小;其次,针对特征区间划分的问题,采用K均值实现特征区间的动态划分,得到粗糙特征区间(RFI)和提纯特征区间(PFI);最后,针对PFI提出一套快速判分的过滤机制,同时针对RFI提出一套基于SVM的过滤机制,该过滤机制的准确度可以达到98.396 6%.模型中选取的特征只需一次扫描就可以完成提取,满足了过滤系统时效性上的需求. 相似文献

12.

基于LightGBM的特征选择算法

李占山姚鑫刘兆赓张家晨《东北大学学报(自然科学版)》2021,42(12):1688-1695

为解决过滤式和基于演化学习的包裹式两类特征选择算法的缺陷,提出一种新型包裹式特征选择算法LGBFS(LightGBM feature selection).首先引入LightGBM对原始特征构建迭代提升树模型并对特征重要度进行度量;随后结合提出的LR序列前向搜索策略LRSFFS对特征进行选择;最后将所提出算法与9种对比算法在21个标准数据集上进行对比,结果显示LGBFS在21个标准数据集中的16个取得最优分类精度、18个取得最优维度缩减率和最优CPU运行时间.还进行了时间复杂度分析与显著性检验,检验表明LGBFS相较6种对比算法具有显著性差异,也说明LGBFS能够同时兼顾特征子集的计算效率和分类精度. 相似文献

13.

降噪分层映射算法在多维聚类分析中的优化研究

刘云张轶郑文凤《四川大学学报(自然科学版)》2022,59(1):013001-86

为了在多维聚类分析中运用有效的深度特征选择方法排除冗余和无关的特征属性,学习数据元素的非线性关系提取最佳特征,提出一种降噪分层映射算法(DHM).首先,基于降噪自动编码器构建非循环神经网络,容错数据经过隐藏层加权和激活函数的训练获取输入数据的非线性关系得到特征空间,实现特征重构选取最佳特征.其次,特征空间用于调整自组织特征映射神经网,通过计算最小化加权平方欧式距离寻找匹配的获胜神经元.最后,结合特征选择网络和无监督聚类网络为降噪分层映射神经网,通过整体模型迭代训练,使权重参数和偏差向量同时得到优化,实现有效的无监督聚类方案.在真实数据集上的实验结果表明,同AESOM,DCSOM和S-SOM算法相比,DHM算法在提高聚类质量及准确性方面有更好的表现. 相似文献

14.

决策表最优特征子集的选择--基于粗集理论的启发式算法 总被引：5，自引：0，他引：5

潘韬赵卫东盛昭瀚《东南大学学报(自然科学版)》2000,30(5):118-122

特征子集选择问题是机器学习的重要问题。而最优特征子集的选择是NP困难问题,因此需要启发式搜索指导求解。基于粗集理论,本文提出了一种新的决策表最优特征子集选择的启发式算法。和以往的方法相比,这种算法简单实用,在一定条件下能够以较高的效率得到最优特征子集。相似文献

15.

基于集成特征选择策略的基因共表达模式识别

王浩畅李钰李斌吴旻《吉林大学学报(信息科学版)》2017,35(5):525-532

为有效识别内含子 miRNA 及其宿主基因共表达模式, 提出了一种基于集成特征选择的识别方法。首先使用基于支持度的集成特征选择算法, 获取相关性和稳定性较高的特征子集, 再使用封装式特征选择方法结合 FCBF(Fast Correlation-Based Filter)搜索策略进一步去除冗余特征和弱相关的特征, 获得最优的特征子集。实验结果表明, 该方法融合了多个特征选择方法的优点, 能提高学习模型的泛化能力并能有效识别内含子 miRNA 及其宿主基因的共表达模式。相似文献

16.

基于粗集的贝叶斯分类器算法 总被引：3，自引：0，他引：3

郑建军刘炜刘玉树王蕾《北京理工大学学报》2003,23(1):83-86

C^3I系统在解决威胁度估计等问题时，应根据环境恰当确定影响威胁度等指标的诸属性，提出了基于粗集的贝叶斯分类器算法，该算法在基于粗集的属性约简方法的基础上，综合考虑条件属性和决策属性间的依赖性以及条件属性间的依赖性对约简的影响，通过基于依赖性的属性约简，改善属性变量间独立性限制，发挥贝叶斯分类器的鲁棒性潜能，优化贝叶斯分类器性能，实验证明该方法解决威胁度估计等C^3I系统中的问题，效果良好。相似文献

17.

一种广义加权模糊聚类算法 总被引：2，自引：0，他引：2

包志强吴顺君韩冰《华中科技大学学报(自然科学版)》2007,35(Z1)

提出了一种广义的加权模糊聚类新算法来处理具有不同特征贡献和不同数据分布的混合属性数据.分别利用样本概率密度思想和ReliefF算法为每一个样本和每一维特征分配权值,通过样本和特征的加权,将模糊c均值算法、模糊c-modes算法、模糊c-原型算法以及样本加权聚类算法统一为一个通用的框架.不同测试数据集的实验结果证明,这种广义的模糊聚类新算法对于处理不同分布以及具有不同特征贡献的大数据集是相当有效的. 相似文献

18.

基于粗糙集和证据理论的决策规则提取 总被引：2，自引：1，他引：1

孙艳胜袁福宇于卓尔王建宇路楠周春光《吉林大学学报(理学版)》2007,45(4):577-581

提出一种基于粗糙集和证据理论的两阶段决策规则提取算法, 该算法首先利用粗糙集中属性缩减的思想, 找出每条规则中的重要条件属性集合, 然后再基于证据理论中证据结合的思想进一步去掉重要条件属性集中的冗余条件属性, 从而得到最终的决策规则. 所给算法简化了属性集的约简, 对高维数据也是可行的. 实验结果表明, 利用该算法能够挖掘出高质量的决策规则. 相似文献

19.

改进的mRmR特征选择方法在人体行为识别中的应用

王华华黄龙周远文赵永宽《重庆邮电大学学报(自然科学版)》2019,31(2):261-269

在基于惯性传感器人体行为识别的研究中,特征选择的作用是挑选相关特征,以提高分类性能,去除冗余特征以降低计算复杂度。针对传统的过滤式特征选择方法仅使用一种相关度量系数筛选特征效果不佳的问题,提出一种改进的基于最大相关与最小冗余(mRmR)准则的特征选择方法。该方法在基于mRmR准则下,采用多种相关度量系数融合的方式,在考虑分类类别的条件下,分析待挑选特征与已选特征间的相关性对特征筛选可能产生的积极影响,以去除部分冗余、不相关特征,进而得到初选特征子集;然后利用二进制数对筛选后的特征编码,通过遗传算法搜索最优或次优特征子集。分别使用SVM和KNN分类器对7种日常行为进行分类。实验结果表明,与其他几种方法相比,该方法对实验分类的7种行为有最高的总体平均识别精度,通过SVM和KNN分类的各行为总体平均识别精度分别达到了97.02%和95.73%,与传统的mRmR方法相比,分别提高了13.72%和9.92%。相似文献