首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
【目的】抑郁症分类诊断研究中,特征选择扮演了重要角色。【方法】针对现有超图正则化特征选择缺失组效应信息问题,提出基于组套索的超图正则化特征选择方法。首先,对抑郁症功能磁共振影像(functional magnetic resonance imaging, fMRI)数据集进行预处理。其次,基于预处理后的功能磁共振数据,构建5个不同尺度的脑网络模型并计算拓扑属性提取特征。基于提取的特征,利用组套索方法构建超图,利用超图正则化特征选择方法进行特征选择。最后,使用支持向量机构建分类模型并评估分类性能。此外,还在UCI数据集中验证了所提方法的有效性。【结果】所提方法在5个不同节点定义模板下,均高于传统的特征选择方法。此外,在模板的节点数量相似的情况下,此方法有更高的分类诊断性能。  相似文献   

2.
现有对低级别胶质瘤(low-grade glioma, LGG)分子亚型三分类的研究依赖于LGG医学影像数据,数据样本少且难获取导致模型较难学习到LGG分子亚型之间的差异,降低了模型的分类性能。基于此,提出了LGG分子亚型三分类方法MODDA,利用基因注意力网络提取LGG多组学数据的重要特征,使用嵌入网络处理临床数据得到临床数据特征;将临床数据特征与组学数据重要特征进行融合,采用密集深度神经网络进行LGG分子亚型分类。实验结果表明,MODDA的分类性能优于现有LGG分子亚型分类方法,并且在外部验证数据集上也表现出较好的泛化性能。此外,对卡方检验过程中发现的重要基因进行了富集基因本体论(gene ontology, GO)术语和生物学途径分析,有助于LGG的个性化治疗。  相似文献   

3.
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83; 与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大; 在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。  相似文献   

4.
很多学者用“全球恐怖主义研究数据库”GTD数据集,采用博弈论、K近邻法和支持向量机等分析恐怖事件的聚集性,已经取得一些成果.但在前期研究中未有很好考虑数据的稀疏性以及高维度多冗余等会导致聚集分类准确率不高的问题.本文提出一种基于最小冗余最大相关与因子分解机结合的TFM分类模型,使用增量搜索方法寻找近似最优的特征解决高维度多冗余问题和FM方法解决数据稀疏问题,并对预处理后的恐怖袭击事件数据用TFM模型做量化分类.文中使用朴素贝叶斯NB、支持向量机SVM、逻辑回归LR与TFM等4个模型的“马修斯相关系数”MCC进行比较,结果显示TFM的MCC相对于其他三个模型NB、SVM、LR分别提高了49.9%,2.5%,2.3%,可见TFM模型有一定可行性.  相似文献   

5.
6.
文本情绪多标签分类是一种细粒度的文本情感分析,通过挖掘文本中蕴含的多种情绪信息,为文本分配多种所属的情绪标签。文章提出一种基于标签特征的卷积神经网络(CNN)情绪多标签分类方法,首先利用word2vec模型对文本进行词向量表示,然后利用标签特征来强化文本情绪和标签之间的联系,将其融合于CNN模型中,用于对文本情绪进行深层次的表示和多标签分类。为了验证方法的有效性,选取了CLR和LPLO两个多标签分类方法作为基准方法,在NLPCC2014的中文微博情绪分析数据集进行比较实验。结果表明,使用标签特征的CNN模型,可以提升微博情绪的分类性能。  相似文献   

7.
提出了一种基于L_2正则化逻辑回归(LR)的阿尔茨海默病(AD)诊断算法.在该模型中使用了L_2范数对LR进行正则化处理,正则化参数通过十倍交叉验证来选择,同时使用了独立成分分析对预处理后的数据进行降维处理,最后使用了牛顿算法来求出模型的最优权值.通过这一算法可以有效分辨出AD及其早期阶段轻度认知障碍(MCI).实验在AD vs.CN,MCI vs.CN和LMCI vs.EMCI 3组分类任务中获得的分类准确率分别为95.22%,81.22%和74.35%.实验结果证明其为一种有效的诊断算法.  相似文献   

8.
提出了基于XLNet的双通道特征融合文本分类(XLNet-CNN-BiGRU, XLCBG)模型。相对于单模型通道,XLCBG模型通过融合XLNet+CNN和XLNet+BiGRU这2个通道的特征信息,能提取更加丰富的语义特征。XLCBG模型对融合后的特征信息分别采用了Maxpooling、Avgpooling和注意力机制等处理方式,分别提取全局中特征值最大的向量、全局中的均值特征向量、注意力机制的关键特征来代替整个向量,从而使融合特征处理的方式多样化,使最优分类模型的可选择性增多。最后,将当前流行的文本分类模型与XLCBG模型进行了比较实验。实验结果表明:XLCBG-S模型在中文THUCNews数据集上分类性能优于其他模型;XLCBG-Ap模型在英文AG News数据集上分类性能优于其他模型;在英文20NewsGroups数据集上,XLCBG-Att模型在准确率、召回率指标上均优于其他模型,XLCBG-Mp模型在精准率、F1指标上均优于其他模型。  相似文献   

9.
Takagi-Sugeno-Kang(TSK)模糊系统的一致逼近能力和可解释性使其可以直观高效地描述复杂的非线性不确定系统,可以有效地应用于模式分类.然而,对于单调分类任务,现有的模糊分类算法并没有考虑单调数据存在的有序关系,因此这些算法对于单调分类任务在模型的复杂度和分类性能方面有待改进.针对此问题,提出了面向单调分类的简洁单调TSK模糊系统建模方法(Concise Monotonic TSK Fuzzy System for Monotonic Classification,CM-TSK-FS),引入有序互信息进行单调特征选择,然后利用抽取的特征来训练TSK模糊系统进行分类识别.该方法有如下优点:(1)由于对单调数据进行了特征选择,新方法降低了TSK模糊系统规则的复杂性,因而得到的模糊系统更加简洁;(2)由于在特征抽取时考虑了单调数据的特征值和决策值之间的单调性,使得训练的模型的分类性能也有了一定程度的提高.在多个单调数据集上进行了实验验证,实验结果表明:面向单调分类的简洁单调TSK模糊系统在处理单调数据集时,通过选取重要的单调数据特征,不仅可以降低其模型的复杂性,还可以提高分类精度.  相似文献   

10.
火源热释放速率的准确测量对深入理解火灾演变过程至关重要,然而目前被广泛使用的氧耗法所需设备造价昂贵,成本较高。该文提出了一种基于机器学习的综合性框架,用于输入温度数据预测火源热释放速率。基于火灾动力学模拟(FDS)软件模拟ISO 9705房间内不同参数的火灾场景,获取不同位置的温度数据,并建立火灾数据库。分别基于最小绝对收缩和选择(Lasso)、随机森林(RF)两种模型的递归特征消除(RFE)算法进行特征筛选,得到两个不同的低维特征子集,并设置对照组。基于不同的特征子集,分析比较了线性回归(LR)、K最近邻(KNN)和轻量级梯度提升机(LightGBM)3种典型模型对热释放速率的预测性能。结果表明:基于随机森林模型的递归特征消除算法筛选所得的特征子集训练的LightGBM模型预测效果最佳,预测结果的根均方误差(RMSE)和均绝对误差(MAE)分别为23.89 kW和15.49 kW,决定系数为0.991 6。该基于机器学习的综合性框架预测效果优异且实施成本较低,为预测火源热释放速率提供了有效途径。  相似文献   

11.
针对图像分类中的特征选择问题,提出一种多特征筛选与支持向量机相融合的图像分类模型.首先提取图像的多种特征,并对特征进行归一化处理;然后根据平均影响值对特征进行筛选,选择一组最优的特征子集;最后采用支持向量机构建图像的多分类器.采用图像数据集SIMPLIcity进行仿真实验验证该模型的有效性.实验结果表明,该模型降低了图像分类的开销,提高了图像分类性能.  相似文献   

12.
To illuminate the necessity of model evolvement and reuse, dynamics of injection molding machine's product models are analyzed. The performance knowledge is used to support the model evolvement and reuse. The driven factors of mechanical product model are concluded. The dynamic characteristics of reuse. Finally, HT1800X1N series injection molding machines are taken as examples to illuminate that the arithmetic is correct and practical.  相似文献   

13.
提出了一种基于分类算法的潜在好友推荐系统. 该系统采用两步特征方法处理原始数据集,去除不相关特征项和冗余特征项,为分类器提供精简的特征集合;把学者潜在好友推荐问题转化为二分类问题,对比4个常用分类器在两步特征选择方法上的分类效果,并找出推荐效果最佳的分类器(决策树分类器),同时得出学术社交网络中区分度最大的6个用户特征信息. 使用来自学术社交网络学者网(SCHOLAT)的社交网络信息作为实验原始数据集进行测试,实验结果显示,相比传统方法,基于分类的推荐方法在准确率和F1值均有显著提升,体现了基于分类算法的潜在好友推荐系统的准确性和实用价值.  相似文献   

14.
现有过滤式特征选择模型采用贪心策略结合互信息评价特征子集,容易陷入局部最优陷阱.考虑标签信息对冗余度的影响,利用一种改进的MIFS-U方法在给定标签的条件下衡量冗余度,采用基于分解的多目标优化框架结合引入多项式突变的差分进化算子进行全局搜索,避免搜索陷入局部最优.引入l1正则化项来保证特征子集的稀疏性,并提出了新的特征选择算法MOEA/D-DEFS.实验阶段使用knn-5分类器来验证学习效果,并在多组来自不同领域的数据集上进行测试.结果表明,将特征选择视为多目标问题采用全局搜索策略搜索可以在特征子集维度和分类准确性方面提供更好的性能.  相似文献   

15.
为解决过滤式和基于演化学习的包裹式两类特征选择算法的缺陷,提出一种新型包裹式特征选择算法LGBFS(LightGBM feature selection).首先引入LightGBM对原始特征构建迭代提升树模型并对特征重要度进行度量;随后结合提出的LR序列前向搜索策略LRSFFS对特征进行选择;最后将所提出算法与9种对比算法在21个标准数据集上进行对比,结果显示LGBFS在21个标准数据集中的16个取得最优分类精度、18个取得最优维度缩减率和最优CPU运行时间.还进行了时间复杂度分析与显著性检验,检验表明LGBFS相较6种对比算法具有显著性差异,也说明LGBFS能够同时兼顾特征子集的计算效率和分类精度.  相似文献   

16.
特征构造的难题在数据挖掘过程中一直存在,传统固化的特征工程对于业务场景千变万化的数据挖掘任务所带来的效益十分有限,因此解决特征工程的特征构造问题已经成为数据挖掘的瓶颈之一;尤其在机器学习算法快速发展的情况下,特征逐渐成为模型中急需重视的部分。基于电商平台的用户行为数据,在原有特征群的基础上提出了二次组合统计特征的构建方法。利用二次交叉衍生出丰富而又切合业务场景的特征群,同时结合两种滑动窗口的方法,分别是定长滑动窗口获取更多的训练样本,变长滑动窗口获取具有时间权重的训练特征,以此来最大限度地还原出用户真实的行为习惯。最后,使用不同的特征组合结合降维的方法建立对照检验模型;并利用线性的逻辑回归模型、线性支持向量机以及树模型极端随机森林与XGBoost对模型进行交叉验证。结果表明,组合特征在树模型的算法中得到了非常好的表达效果;而且无论在线性模型还是树模型中衍生特征群模型的F1值都优于基础特征群。  相似文献   

17.
针对视网膜图片质量差异性大,质量分级模型泛化性能不足的问题,本文提出一种基于锐度感知最小化(Sharpness Aware Minimization,SAM)的多色域双级融合分级方法,用于视网膜图片质量评估。该方法首先采用RGB、HSV和LAB三种色域空间作为模型的特征提取空间,并利用ResNeSt作为特征提取网络,提取不同色域的空间特征。然后利用模型的特征级与预测级进行双级融合,再利用SAM优化方法提高视网膜图片质量分级模型的泛化性能。最后在EyeQ数据集上进行实验仿真,其准确率为87.35%、精确度为85.87%、敏感度为85.07%、F值为85.44%,所提方法的整体分级性能优于其他方法。  相似文献   

18.
为了提高分类的精确度,提出一种基于粗糙集理论的增强学习型分类器。采用分割算法对训练数据集中连续的属性进行离散处理;利用粗糙集理论获取约简集,从中选择一个能提供最高分类精确度的约简。对于不同的测试数据,由于离散属性值的变化,相同的约简可能达不到最高的分类精确度。为克服此问题,改进了Q学习算法,使其全面系统地解决离散化和特征选择问题,因此不同的属性可以学习到最佳的分割值,使相应的约简产生最大分类精确度。实验结果表明.该分类器能达到98%的精确度.与其它分类器相比.表现出较好的性能。  相似文献   

19.
基于已有研究,找出射出成型制程消耗能量之简易估算式直交表数学模型及重要参数因子.以一中央进胶单模穴之圆形薄板为模具.利用田口实验,使用Moldex3D模流分析软件仿真实际射出成型制程,并以消耗能量简易数学模型估算各实验组之耗能.为了同时得到高质量(低体积收缩率、低总位移)及低耗能之制程参数,以薄板模具之体积收缩率、总位移量为质量特性。探讨比较各实验组之质量及耗能.分析本案例,在保压时间1—2S、模温25~35℃时.可得到既节能又高质之制程加工参数.与相仿之高质量产品的制程能源消耗比较表明,本案之节能成效可提升43%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号