首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于基因表达谱的肿瘤诊断方法有望成为临床医学上一种快速而有效的诊断方法,但由于基因表达谱数据存在高维数、小样本以及噪音大等特点,使得对其分类存在很大困难,所以很有必要寻找更为可行有效的分类方法.用贝叶斯分类器建立预测分类模型作为基因表达谱数据分类的一种新思路,以结肠癌的基因表达谱作为实验数据,利用MATLAB的贝叶斯网...  相似文献   

2.
针对NCA算法对初始值敏感的不足,提出一种改进的NCA算法(INCA).INCA对肿瘤基因表达谱进行奇异值分解,将标准化后的右奇异矩阵作为初始值,提取肿瘤基因表达谱中的分类信息.在4个标准肿瘤基因表达谱数据集上进行实验,以INCA作为特征提取方法,K-近邻、Parzen窗作为分类器进行分类检测.实验结果表明,与NCA及现有的分类模型相比,基于INCA的分类模型能够取得较高的分类准确率.  相似文献   

3.
针对关联分类算法产生的规则普遍存在分类器分类精度、效率低的问题,提出了一种提取有效规则的关联分类算法--ACDER算法.首先定义了剩余支持度和剩余置信度,然后通过计算规则剩余支持度和剩余置信度建立了分类器并进行剪枝,以达成对分类尽量少且最有效的规则构成分类器,确保分类器中不存在任何冗余规则和冲突规则.在8个数据集上的测试结果表明,所提算法的平均分类精度比关联规则算法提高了4.15%,而在所有数据源分类器上的规则数却减少了54%.  相似文献   

4.
为了充分利用数据信息进而提高分类正确率,提出一种证据神经网络的分类器,并据此构造了多分类器系统。首先将训练数据中的含混数据视为新类别——混合类,将原始的训练数据重组成含有混合类的训练数据,然后使用证据神经网络分类器系统用重组后含混合类的训练数据进行训练,对分类输出进行证据建模,并使用多种不同的证据组合规则实现多分类器融合。采用人工数据集和UCI数据集进行对比实验,结果表明:与其他采用神经网络的多分类器系统相比,采用证据神经网络的多分类器系统能有效提高分类正确率;在数据集Magic 04和Waveform2上,采用提出的多分类器系统比采用投票法的神经网络多分类器系统的分类正确率分别提高了6%和10%左右。  相似文献   

5.
赵洁茹 《科技资讯》2011,(33):235-235
肿瘤基因表达数据的模式识别是在已有数据的基础上建立分类器,并利用所建立的分类器对未知样品的状态进行判别。肿瘤基因表达谱数据的特点是矩阵的维数不断增加,而且样本的数目却较少。支持向量机可以处理高维数据,并且支持向量机的分类精度很高,抗噪能力也很强,使得支持向量机在肿瘤分类中有了充分的应用。  相似文献   

6.
针对基因表达谱微阵列的数据多分类问题,给出一种在多病类情况下的基于信噪比和相关性的特征基因选择方法.该方法一次性考虑基因区分所有病类的能力,尽量避免基因的冗余性;其次利用支持向量机,构建了基因表达谱微阵列数据的多分类器;最后通过实验表明了本方法的有效性.  相似文献   

7.
为提高分类系统的性能,提出一种统一多种元学习算法的元学习框架,定义并描述了并行和串行两种组合方式.由基分类器的分类结果构成新属性,并加入到特征向量中以形成元数据.通过扩展特征向量,元学习增强了对假设空间的表达能力,降低了系统的偏差.在加州大学提供的标准数据集上对元学习策略进行了实验研究,结果表明:与多数投票、最大规则、最小规则等融合方法实现的多分类器系统相比,并行和串行组合在所用数据集上的平均分类错误率可分别降低39.12%和40.56%,且在n分交叉验证中n值的增加并不能改进分类性能,串行组合中的基分类器的顺序对分类错误率没有显著影响.  相似文献   

8.
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.  相似文献   

9.
针对基因芯片数据量大、样本数低和基因维数高的特点,提出了一种对基因芯片数据进行多步骤降维处理的分类方法.第一步,采用基因表达差异显著性分析方法(SAM)筛选得到差异表达基因子集.第二步,采用支持向量机(SVM)分类器对该差异表达基因子集进行进一步的分类降维.将该方法用来处理大肠癌和白血病数据集,得到了数量较少而分类能力较强的特征基因子集.实验结果证明该方法可以快速有效地筛选肿瘤特征基因.  相似文献   

10.
采用线性回归树作为弱分类器,再由多个弱线性回归树组成强分类器以提高分类能力.从而在不增加特征数的情况下,通过线性回归树将特征进行自动组合以提高弱分类器的分类能力,相应地可以用更少的弱分类器组成分类能力更强的强分类器完成分类任务.对PETS2006视频序列以及公交车内视频序列的目标进行了检测,证明其具有较强的分类能力和较好的检测效果.  相似文献   

11.
应用主成分分析(principal component analysis,PCA)法对从90#和93#两种汽油的50个实验样所取的特征数据进行降维处理,再结合Fisher判别方法对这两种汽油进行分类,并将分类结果与不采用PCA法而直接计算数据所得出的Fisher判别结果进行比较,前者的分类正确率达到100%,而后者却只有50%.结果说明采用PCA方法事先对数据处理可以大大的提高汽油分类的准确性.  相似文献   

12.
针对传统流量分类方法(基于端口和有效载荷)分类不可靠的问题,提出基于C4.5决策树算法,根据训练集中属性的信息增益比率构建分类模型,按属性对测试数据集进行预测,通过查找分类模型实现对网络流量的分类。在公开数据集和自己采集的数据集上进行实验,结果表明,采用C4.5决策树算法对网络流量分类,平均分类精度为93%,单类别分类精度均在90%以上,能有效地实现对网络流量应用类型的识别。  相似文献   

13.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

14.
针对基于传统机器学习方法设计的DR胸片肺结核检测器存在着泛化能力不强,实际检测精度低等问题,提出了一种基于Focal Loss的深度学习检测方法Tuberculosis Neural Net(TBNN).医学图像的特殊性,存在带标注的数据量小导致无法充分训练深层网络模型等问题.该方法利用肺炎和肺结核同为呼吸道感染疾病且在DR胸片上有相似表征的特点,基于迁移学习原理训练特征提取子网络,减少肺结核胸片样本不足对模型训练造成的影响.首先在大型的肺炎胸片数据集上训练特征提取网络,以获取DR图像中丰富的深层图像语义信息,然后使用样本较少的肺结核数据集微调网络参数,并将多层卷积的输出作为TBNN分类子网络的输入,得到基于DR胸片的肺结核病灶检测模型.实验结果表明,该方法生成的检测模型在分类精度和性能上均优于基于传统机器学习的肺结核检测器.在同等训练数据量和训练周期下,模型性能高于其他采用传统数据增强方法的深层网络肺结核检测算法,且能标识病灶区域,准度上有不低于放射科阅片医生的表现.  相似文献   

15.
分类算法的现有评价指标存在一些问题,主要是评测数值在不同的数据集上呈现剧烈波动。为解决这一问题,通过考察数据集对分类结果的影响,提出了一种对分类算法的新评测指标new-macro-F1。这一新评测指标将数据集的因素从评测过程中独立了出来,使得new-macro-F1表示的仅仅是分类算法本身。实验结果表明使用新评测指标,同一分类器在不同数据集上的表现波动较小;通过分类器在一个数据集上的表现,可以近似的估计该分类器在另一数据集上的分类质量。  相似文献   

16.
为能够更好地从高特征维度的DNA微阵列数据中挖掘癌症相关基因,实现对恶性肿瘤的分子分型,提出了一种基于演化超网络模型的DNA微阵列数据分类方法?演化超网络是受生物网络启发而建立的一种认知学习模型,其学习过程非常适用于发掘基因间的相互作用?该方法采用信噪比进行基因选择,选择后的基因经归一化后用于演化超网络的学习和分类?通过急性白血病和结肠癌2种数据集进行实验,结果表明,演化超网络在分类精度方面与当前其他方法有较高的可比性?  相似文献   

17.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

18.
对于水军评论检测问题,已有方法在提取用户行为关系以及通过神经网络提取特征时复杂度过大,同时由于网络评论属于短文本类,其书写的不规范会导致训练过程中文本特征提取困难;另外,已有方法对数据集不平衡分布情况考虑不足。为此,提出了一种基于双层堆叠分类模型的水军评论检测方法。首先通过三元组形式构造矩阵表示用户间关系,并通过主成分分析得到低维用户关系表示,以此刻画用户在评论数据中的行为差异并且降低计算的复杂度;然后,通过评论的段落向量表示以及计算离散型特征(包括文本相似度、信息熵等)解决文本特征难以提取的问题;最后将三者相联结作为融合文本与行为特征的整体特征表示。利用集成学习的方法构造双层堆叠分类模型对评论分类,以提升模型在非平衡数据集下的检测性能。实验采用Yelp2013评论数据集,结果表明,与目前最好的基准方法对比, F1值提高了1.7%~5.2%,在非平衡数据集中提升尤为明显。  相似文献   

19.
为了提高脑机接口中P300脑电信号的分类准确率和计算速度,提出一种组稀疏贝叶斯逻辑回归的P300脑电信号通道自动选择算法.该算法首先在贝叶斯框架下建立P300脑电信号的解码模型,其次提出先验的组自动相关确定(GARD)方法构建组稀疏约束下的P300脑电通道权重系数,最后通过最大似然估计来求解超参数并选出P300脑电通道最优子集,避免了大量的交叉验证过程.所提方法在BCI竞赛数据和自采集数据上进行了验证分析.实验结果表明,所提的方法能够自动选择P300脑电通道子集,提高了P300特征分类准确率.  相似文献   

20.
针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号