首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对基因表达谱微阵列的数据多分类问题,给出一种在多病类情况下的基于信噪比和相关性的特征基因选择方法.该方法一次性考虑基因区分所有病类的能力,尽量避免基因的冗余性;其次利用支持向量机,构建了基因表达谱微阵列数据的多分类器;最后通过实验表明了本方法的有效性.  相似文献   

2.
基于ITAFSVM的微阵列数据特征选择和分类   总被引:1,自引:0,他引:1  
支持向量机已经被成功应用于基因表达谱数据分析。但是,仍有开放问题需要解决:①支持向量机不能自动进行基因表达谱数据的特征选择;②支持向量机的参数优选没有简单有效的办法。一种新型具有良好特性的支持向量机——全间隔自适应模糊支持向量机(TAFSVM)被提出。并且提出一种新的遗传算法——智能遗传算法(IGA)来设计一个TAFSVM分类器,称为ITAFSVM,同时优化TAFSVM参数集和特征选择,并且结合10-fold交叉验证来确定其泛化能力。最后将ITAFSVM应用于四种基因表达谱数据集。通过与进化支持向量机(ESVM)方法、粗糙集与径向基神经网络组合(RBF-RBFNN)方法进行了比较,实验结果表明运用ITAFSVM不仅可以自动进行基因表达谱数据特征选择,而且分类精度和稳定性都较高,速度更快。  相似文献   

3.
癌症基因表达数据的熵度量分类方法   总被引:5,自引:4,他引:1  
基因芯片技术的出现和发展为生物医学领域带来了深远影响,运用分类方法研究其产生的海量数据对癌症的分类及治疗有重要意义.该文提出一种利用熵度量作为指标进行癌症基因表达数据特征提取的方法.首先对基因表达数据进行筛选并计算各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进行分类.对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有效性.  相似文献   

4.
针对两种类别的肿瘤分类问题,首先运用信噪比方法筛选出表达水平发生显著性变化的特征基因,然后采用支持向量机作为分类器进行肿瘤分类,通过对两种类别的白血病DNA微阵列数据进行计算,达到了97.1%的分类准确度.  相似文献   

5.
传统的粗糙集理论不能处理连续属性,而且得到的分类规则大多比较复杂.支持向量机理论能够得到简洁的分类规则,也能处理连续属性,但仅适用与小样本,对大样本数据集有一定的局限性.文章首先提出了针对连续属性的粗糙集下近似理论,使粗糙集理论能够应用到连续属性.基于上述理论以及支持向量机分类方法仅与支持向量有关的特性.提出了一种先由粗糙集进行预处理的支持向量机分类方法.实验表明,该方法在缩短训练时间的基础上,保留了支持向量机方法所需分类信息,提高了分类精度,克服了SVM算法的应用瓶颈.  相似文献   

6.
通过结合部分自适应弹性网络惩罚和hinge损失函数,提出了一种能同时进行微阵列分类和基因选择的自适应双正则化支持向量机模型,并证明了该支持向量机具有自适应群体基因选择性能.  相似文献   

7.
针对现有数据挖掘模型解决客户价值分类的不足,提出了基于粗糙集和支持向量机理论的客户分类模型,该模型首先应用粗糙集理论对主要指标属性进行特征提取,约简出主要指标体系,然后将训练样本送入支持向量机进行学习和训练,进而对检验样本的客户类别进行判别.结果表明:与传统的客户分类模型相比,基于粗糙集和支持向量机的客户分类模型对检验样本的预测精度更高,具有良好的分类效果,是一种更为高效和实用的分类方法.  相似文献   

8.
基因数据分类方法的研究是当前生物信息学的一个热点,利用基因微阵列技术所提供大量的基因数据为诊断不同种类的基因疾病提供了可能。依据基因表达谱建立有效的模型对肿瘤类型的识别、诊断和治疗具有重要应用价值。通过对肿瘤基因表达谱进行分析,提出一种新的去无关基因的分析方法。新方法首先通过引入参数数量与改进的信噪比结合,对已有的基因信噪比(REFSC)公式进行改进,然后用主成分分析法提取主要的分类信息,达到特征提取的目的。最后用支持向量机(SVM )对样本集进行分类测试,分类模型的核函数分别采用线性linear、多项式polymoid、径向基RBF核函数,对肿瘤样本集进行实验测试,实验表明了新方法是可行的和有效的。  相似文献   

9.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

10.
结合了基因表达数据类内和类间表达差异的信息,提出一种新的基因选择算法,利用它选择出来的特征基因表达作为支持向量机的输入特征向量,对四个常用数据集进行分类,结果表明,该方法可以显著提高分类精度,同时通过对选取出来的特征基因在相关信号通路上的分析,表明该方法能够得到更多的肿瘤相关基因,具有很强的鲁棒性和很高的精确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号