首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 97 毫秒
1.
基于高维数据的特征选择性, 运用功能扰动集成方法, 对4种不同特征选择器的结果进行集成, 得到了分类精度高且稳定性较好的特征子集.  在基因数据集上与原有算法进行性能对比实验, 结果表明, 多特征选择混合算法可使特征选择的结果间具有互补性, 从而有效提高特征选择的稳定性和分类精度.  相似文献   

2.
miRNA作用通路研究   总被引:1,自引:0,他引:1  
后基因组时代的分子生物学研究需要从整体的角度,系统地阐述基因参与的生物调控过程,已有的通过构建基因调控网络的方式所做的系统生物学研究主要关注于蛋白编码基因之间的相互作用。随着近年来非编码RNA(noncoding RNA),特别是miRNA研究的深入,显示生物体内存在着广泛的基因转录后调控。本论文通过建立综合蛋白质编码基因与miRNA基因相互作用关系的基因调控网络,分析了人类基因组中涉及miRNA的三类作用模式:(1)宿主基因与内含子miRNA共同作用于另一个蛋白编码基因。(2)miRNA簇中的不同miRNA分别作用于存在着相互作用的两个蛋白编码基因。(3)由两个宿主基因与其各自的内含子miRNA形成双向负调控回路。本研究的结果为进一步认识人类miRNA基因的功能特性提供了重要参考,研究所预测的数据为实验验证提供了依据。  相似文献   

3.
基因表达数据的研究是生物医学上的一个重要课题。基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤。单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,并将此模型应用到3个不同的基因表达数据集上。为了评价特征子集的分类预测性能,使用支持向量机作为分类器进行测试。实验结果表明:相对于单一的特征选择方法,集成特征选择能够有效提高分类模型准确度。  相似文献   

4.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

5.
特征选择是高维小样本癌症基因数据分析的首要和关键步骤,但是现有特征选择算法存在特征子集依赖于训练样本且随训练样本不同而变化的问题。为了解决特征选择过程的特征子集不稳定问题,提出一种基于核极限学习机的集成特征选择方法,利用5-折交叉验证划分原始数据,对各训练集继续采用5-折交叉验证进行划分并进行特征选择,以所得5个特征子集之并集作为该训练集的特征子集,构造核极限学习机评价该特征子集的分类性能,以原始数据集5-折交叉验证所得特征子集的平均Jaccard系数评价特征选择算法所选特征子集的稳定性。5个基因数据集的实验测试以及与经典特征选择算法SVM-RFE、LLE Score、ARCO、DRJMIM、Random Forest和mRMR的实验比较表明,本文算法不仅能选择到稳定的特征子集,且所选特征子集具有很好的泛化能力。  相似文献   

6.
在基于惯性传感器人体行为识别的研究中,特征选择的作用是挑选相关特征,以提高分类性能,去除冗余特征以降低计算复杂度。针对传统的过滤式特征选择方法仅使用一种相关度量系数筛选特征效果不佳的问题,提出一种改进的基于最大相关与最小冗余(mRmR)准则的特征选择方法。该方法在基于mRmR准则下,采用多种相关度量系数融合的方式,在考虑分类类别的条件下,分析待挑选特征与已选特征间的相关性对特征筛选可能产生的积极影响,以去除部分冗余、不相关特征,进而得到初选特征子集;然后利用二进制数对筛选后的特征编码,通过遗传算法搜索最优或次优特征子集。分别使用SVM和KNN分类器对7种日常行为进行分类。实验结果表明,与其他几种方法相比,该方法对实验分类的7种行为有最高的总体平均识别精度,通过SVM和KNN分类的各行为总体平均识别精度分别达到了97.02%和95.73%,与传统的mRmR方法相比,分别提高了13.72%和9.92%。  相似文献   

7.
针对高维数据包含的不相关和冗余特征影响检测方法性能的问题,提出了集成filter和wrapper方法的混合特征选择新方法.采用基于信息增益的filter方法,删除不相关特征;采用基于改进的自适应遗传算法和评价函数的wrapper方法,获取最优特征子集.在入侵检测中的应用表明,该方法能降低特征选择的时间,检测率和虚警率均优于其它方法.  相似文献   

8.
针对原始故障数据集因"高维"和"海量"引发的"维数灾难"问题,提出一种基于类内类间距离判据和遗传算法相结合的故障特征选择方法.在提取出时域、频域、小波包频带能量作为描述系统状态的原始故障特征集基础上,经类内类间距离判据初次选择剔除不相关特征之后,引入遗传算法二次选择去除冗余特征,得到一种近似最优特征子集.结果表明:基于类内类间距离判据和遗传算法的故障特征选择方法可以剔除不相关和冗余特征,最终得到精简特征子集,并且筛选出的特征子集对故障类型的判别有很高的识别能力.  相似文献   

9.
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.  相似文献   

10.
为了从高维基因表达谱数据中识别出与肿瘤分类高相关的基因子集,提出一种基于最小冗余最大相关(minimal redundancy maximal relevance,mRMR)和改进磷虾群(improve krill herd,IKH)算法的两阶段混合特征选择算法,即采用最小冗余最大相关算法评价特征重要性以筛选出高相关、...  相似文献   

11.
12.
Virus-encoded microRNAs (miRNAs) are a new kind of miRNAs that regulate the expression of target gene in host cells or viruses through inducing cleavage of mRNA, repressing translation, etc., and change the processes of host cells or replicate viruses to escape or resist immune surveillance of host and protect viruses themselves. It has become a hot topic to discover viral genes encoding miRNAs and their target genes, and to identify their functions. This review provides background information on the history of virally encoded miRNAs including their genomic distribution, functions and mechanisms. In addition, we discuss the similarities and differences between virus- and host-encoded miRNAs, the future directions of researches in viral miRNAs and their applications in diseases control and therapy.  相似文献   

13.
14.
针对多尺度目标检测中特征图特征混淆和特征丰富程度不足的问题,提出一种基于多尺度特征选择与融合的目标检测算法。设计了一个特征选择模块来分离出不相关的特征,并结合特征金字塔网络形成特征选择网络结构,降低特征图中不同尺度目标的局部特征对当前尺度特征的干扰;提出一种浅层特征融合方法,将浅层特征逐级融合到较深层级特征中,解决特征图的特征不够丰富问题。结合特征选择架构和浅层特征融合架构,在PASCAL-VOC2007数据集上进行测试,结果mAP达到了80.1%。相较于基础的单阶段目标检测(single shot detection,SSD),所提算法的网络性能可提高2.9%,且在一些小目标和遮挡目标的检测效果上有明显的提升。通过对比和消融实验,证明了所提方法的有效性。  相似文献   

15.
为了提高模糊粗糙集特征选择算法的计算效率,在每次迭代过程中通过不断缩减样本和特征的搜索范围,提出了一种新的模糊粗糙集特征选择算法.为了减少样本的搜索范围,利用样本对决策类下近似隶属度的单调性,构建样本的筛选机制,用以筛除当前所选特征子集已保持决策类下近似隶属度的样本;为了缩减特征的搜索范围,采用特征冗余性概念,构建特征搜索机制,用以移除已被确定为冗余的特征;通过融合样本筛选机制和特征搜索准则,设计模糊粗糙集特征选择的高效算法.数值实验表明,所提算法具有高效性和有效性.  相似文献   

16.
提出了差异共表达框架和一个差异共表达评分函数,以观察到的一个双聚类基因在所属双聚类的条件下共表达和在其他条件下非共表达为基础,客观量化基因双聚类的质量.此外,还提出了一个评分函数把双聚类分层为三种类型的共表达.在实现双聚类输出统一排名中,使用提出的评分函数对这4个公认的双聚类算法在不同区域的6个实际数据集上的性能和行为进行测试.实验结果表明,在鉴别共表达双聚类方面,差异共表达框架能有效提高共表达基因双聚类质量和双聚类算法的性能.  相似文献   

17.
针对现有大多数多标签特征选择算法未能有效去除特征空间冗余特征,同时也忽略了标签差异性的现状,提出一种基于相关性分析的多标签特征选择方法,利用特征之间的相关度对特征进行分组,解决了特征之间的相关性问题.根据样本所对应的标签属性对样本做一个正负类的聚类,对于正样本和负样本所构成的正类簇和负类簇单独确定其聚类个数,并计算原特征到正负类簇中各个类中心的距离,如此便产生了标签特定特征空间;将标签共享的特征空间和标签特定特征空间融合,考虑到多个标签之间的个性和关联性,解决了标签的差异性问题.实验测试表明,相较于现有的多标签特征选择算法,提出的基于相关性分析的多标签特征选择方法在各个分类指标上均有较优的表现,充分证明了该方法的有效性.  相似文献   

18.
面部特征中存在长时间不变特征和短时间不变特征,对两种特征分类,使用长时间不变特征完成长时间跨度人脸识别.首先以最佳覆盖为目标的特征对比方式,代替传统的以最佳划分为目标的特征对比方式,使用混合蛙跳算法实现特征对齐.然后根据时间段和特征值变化度计算每个对齐的特征点的权值和基准特征值,对长时间不变特征与短时间不变特征进行分类.在识别过程中,应用已识别的图像信息更新权值和基准特征值,进行长时间跨度的人脸识别.实验结果表明,该方法可以在以年为时间跨度的人脸识别过程中达到82%的识别率,优于其他算法.  相似文献   

19.
本文提出了一种基于综合特征的鞋底识别方法,即提取鞋底的形状、直方图、纹理特征,将这些特征进行内部和外部归一化形成鞋底图像的综合特征.实验结果表明根据鞋底图像综合特征进行识别是很有效的.  相似文献   

20.
提出了一种由遗传算法和改进互信息公式相结合的特征选择方法.将遗传算法中的特征评价函数换为改进互信息公式来对特征进行选择,结合了过滤式和封装式这2种特征选择方法的优点.实验部分采用另外2种特征选择算法与本文所提方法分别进行特征选择,将这3种方法所得到的特征子集用于概率神经网络、BP神经网络分类器上,通过比较对应的分类精度,检验各种特征选择方法的效果. 实验结果显示,所提出的特征选择方法能更为有效的实现特征选择,所取得的特征子集具有更好的泛化特性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号