首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
在基因识别的两类算法中,判别算法通常需要正负两类样本来训练参数.在原核生物的基因组中,由于可充当负样本的基因间序列太少,如何产生负样本便成为原核基因识别中的一个问题.本文提供了一种基于“自相似映射”的负样本生成算法,与通常使用的随机生成算法不同,该算法不需要生成随机数.本文给出了两种负样本生成算法的比较,并初步讨论了自相似性对于DNA序列分析的意义.  相似文献   

2.
癌症通常由基因发生突变引起,因此从大量基因中有效地识别出少量致癌基因具有重要意义.针对基因表达谱数据高维小样本的特点,将支持向量机递归特征消除(SVM-RFE)和特征聚类算法相结合,提出一种新的基因选择方法:K类别SVM-RFE(K-SVM-RFE).该算法通过特征排序算法去除大量无关基因,利用K均值聚类算法将相似基因聚为一类,并通过两次SVM-RFE算法精选致癌基因.随后将K-SVM-RFE算法应用于多个基因表达谱数据集,并对其中的关键参数设置进行了讨论.实验结果表明K-SVM-RFE算法所选基因较已有方法在分类准确率上有显著提高,特别是在选择少量致癌基因上效果提升更为明显.  相似文献   

3.
指出了正确识别定位DNA序列中外显子区间是当前生物信息学最基础的问题之一.通过介绍DNA序列的3-周期性、信噪比等概念,引入了固定长度滑动窗口和移动信噪比曲线识别两种基因识别算法,在综合两种算法的复杂度和准确性优势的基础上,提出了基于信噪比特征的基因识别改进算法,并通过实验验证了该算法的有效性与准确性.  相似文献   

4.
地理知识图谱的表示学习需要根据正样本生成对应的负样本,然而传统的负样本生成算法存在错误率高、地理知识图谱适配性差的问题。针对这一问题,调整空间关系在地理知识图谱中的表达方式,提出基于空间约束的负样本生成方法,并将该方法应用至不同的知识图谱表示学习模型,探讨其在地理知识图谱表示学习中的适配性。结果表明,该算法具有较低的错误率,同时适用于常见的两类知识图谱表示模型,能够提高地理知识图谱表示学习的精度,有助于地理知识图谱在地理研究中发挥更重要的作用。  相似文献   

5.
启动子的潜在语义索引差异识别算法   总被引:1,自引:0,他引:1  
启动子是基因前面的一个短序列,定位启动子即能找到基因,因此启动子的识别具有重要意义.潜在语义索引差异模型(DLSI)能够扩大类间的差异,降低噪声的干扰,从而提高识别的精度.本文提出基于DLSI的启动子识别算法,利用潜在语义索引差异模型进行特征词选择,通过将样本变换到潜在语义空间中实现降维,建立了启动子-外显子、启动子-内含子分类器,把两分类器的串联结果作为最终的分类结果.实验验证了算法的有效性.  相似文献   

6.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

7.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

8.
MCL聚类算法求解植入(l,d)模体识别问题   总被引:1,自引:0,他引:1  
模体识别是指寻找一系列功能相近且形式相似的基因片段.为此将MCL聚类算法引入模体识别应用,设计出一种适用于这个问题的新算法,在一组目标DNA序列中找到拟识别的模体.该方法基于马尔科夫链原理,构建概率转移矩阵,按随机游走方式对矩阵进行扩展、膨胀迭代,最终形成各个样本的分类.在此基础上进行贪心算法求精计算,得出若干组模体.实验表明该算法是有效的.  相似文献   

9.
提出了一种基于非负稀疏表示(nonnegative sparse representation,NSR)的半监督学习标签传播算法.该算法首先构造一个稀疏概率图(sparse probability graph,SPG),其权重由非负稀疏表示算法计算的非负系数组成,自然地反映了各样本之间的聚类关系,避免了传统半监督学习算法中的邻居选择和参数设置过程;然后通过对未标记样本的标签进行迭代繁殖至收敛而获得所有样本的标签.在人脸识别、物体识别、UCI机器学习和TDT文本数据集上的实验结果表明采用非负稀疏表示的标签传播算法比典型的标签繁殖算法具有更好的分类准确率.  相似文献   

10.
在时序分析中,人们对于ARMA模型给予了足够重视.在实施模型的识别时,利用样本自相关函数与样本偏相关函数的特征是重要方法之一.另一方面,有许多实际的时间序列可以用低阶ARMA模型来拟合,因而这类模型能够用简便的方法进行识别.本文导出了逐步识别模型的一阶算符法.在算法适用的范围内,能够正确识别模型,获得相应参数的较好估计.  相似文献   

11.
为了获得更高的人脸识别正确率,满足人脸识别的实时性,提出一种基于最佳鉴别特征和相关向量机的人脸识别算法.首先,采用小波变换对人脸图像进行降噪预处理,提取人脸的多方向、多尺度Gabor特征;然后采用核主成分分析对人脸的Gabor特征进行筛选,找到对人脸识别结果影响较大的最佳鉴别特征,有效降低特征数量,去除特征间的冗余信息;最后采用相关向量机对最佳鉴别特征向量进行学习,建立人脸识别的多分类器.选择标准人脸库与经典人脸识别算法进行对比实验,实验结果表明,该算法的人脸平均识别率得到大幅度提高,人脸平均识别时间远少于经典人脸识别算法.  相似文献   

12.
为了简单准确的检测葡萄酒的种类,建立了电子鼻检测系统。以三种具有相似气味的葡萄酒的种类识别为实验背景,根据葡萄酒散发的气味合理的选用了八个气敏传感器。利用主成份分析方法对传感器阵列进行优化,最后确定选用四个传感器为最终的传感器阵列,并借助Fisher判别分析方法检验其效果。使用SVM算法及BP算法分别对不同训练样本数的葡萄酒做对比实验。实验结果表明,基于PCA-SVM模式识别算法有很高的识别精度,很强的分类能力,而且在小样本分类识别实验中有着潜在的优势。  相似文献   

13.
求解统计不相关的最佳鉴别矢量的统一算法   总被引:1,自引:0,他引:1  
Fisher最佳鉴别准则是高维模式分析中的有效方法 ,其关键是求解最佳鉴别矢量。统计不相关的最佳鉴别矢量保证模式矢量投影后得到的特征是统计不相关的 ,已有的计算统计不相关的最佳鉴别矢量算法不能计算小样本的情形 (类内散布矩阵是奇异的 ) ,针对这种情形 ,该文给出了一种对大小样本都能精确计算统计不相关最佳鉴别矢量的统一算法。在大样本情形下 ,该方法得到的结果与已有的方法相同。为验证算法的有效性 ,将其用于人脸识别实验 ,该方法比已有的方法能得到更高的识别率  相似文献   

14.
针对基因表达数据空间分布的特性,提出了一种基于模糊核判别分析的基因表达数据分析方法.方法综合了模糊数学以及核判别分析方法的优点,提高了对基因表达数据分类识别的准确性.以多发性骨髓瘤的基因表达数据为例进行了实验,从实验结果可以看出,采用模糊核判别分析方法可以得到最佳的识别效果.  相似文献   

15.
为了克隆人可溶性TRAIL基因片段,构建其新型原核分泌表达载体,从HL-60细胞中提取总RNA,根据GeneBank提供的人TRAIL基因序列,设计扩增人可溶性TRAIL基因114~281片段的特异性引物,同时引入NcoI、BamHI、TEV酶的酶切位点及His标签,以便纯化及纯化后切去His标签,并将目的基因克隆至原核表达载体PhoA,经测序分析鉴定,于大肠杆菌MM294中进行表达.结果表明:克隆到人sTRAIL基因序列,经DNA测序结果与GeneBank基因库报道的一致,成功构建了可分泌表达的人源可溶性TRAIL原核表达载体PhoA-sTRAIL,并在大肠杆菌MM294中成功表达.  相似文献   

16.
针对目前人脸识别算法的误识率高、 鲁棒性差等不足, 设计一种基于判别分析与低秩投影的人脸识别算法, 以获得更优的人脸识别结果. 首先对人脸图像进行分块, 提取每个子块的局部特征, 并判别分析提取人脸的全局特征; 然后通过低秩投影选择对人脸识别结果贡献较大的特征组成特征向量; 最后采用最小二乘支持向量机根据“一对多”的原则建立光照人脸识别的多分类器, 并对多个人脸数据库进行仿真实验. 实验结果表明, 该算法可找到最优人脸识别特征子集, 降低光照人脸的误识率, 人脸识别速度得到明显提升, 且人脸识别效果优于其他人脸识别算法.  相似文献   

17.
针对行人再识别过程中存在获取的训练样本较少,真实样本分布不一定线性可分和算法识别率低的问题,提出基于卡方核的正则化线性判别分析行人再识别算法(KRLDA,kemel regularized linear discriminant analysis)。该算法首先利用核函数将样本从线性不可分的原始空间映射到线性可分的高维特征空间,然后在高维空间中构造描述数据之间邻近关系的散度矩阵,再利用正则化线性判别分析获得高维到低维空间的投影矩阵,使得数据在低维空间能够保持高维空间的可分性,从而提升行人再识别算法的识别率。在VIPeR、iLIDS、CAVIAR和3DPeS数据集上,实验结果表明所提出的算法具有较高识别率。  相似文献   

18.
利用优化方法求解线性鉴别方程   总被引:1,自引:1,他引:0  
该文采用序列二次规划(SQP)方法求解Fisher鉴别准则模型。介绍了几种优化技术及算法后,分析序列二次规划(SQP)方法相对于线性鉴别准则模型一般求解方法的高效性优点,并结合MATLAB中的优化工具,应用二次规划方法求解Fisher鉴别准则模型,实现两类(人脸图像)问题的分类。该文研究和实现是对Fisher鉴别准则模型解法的新尝试和贡献。  相似文献   

19.
Z Fehér  A Kiss  P Venetianer 《Nature》1983,302(5905):266-268
Methylation of specific cytosines in the DNA is generally believed to play some role in the regulation of gene expression in eukaryotes. However, some eukaryotes, such as Drosophila and yeast (S. Hattman, personal communication) seem not to contain 5-methylcytosine in their DNA. It would be interesting to test, how gene expression in such organisms would respond to the methylation of specific cytosines in the genome. As a first step towards this goal, we have introduced the gene encoding the Bacillus sphaericus R modification methylase, which methylates the internal cytosine within the recognition sequence 5'-GGCC, into yeast cells. Southern-type hybridization to DNAs isolated from the transformed yeast clones revealed that the yeast plasmid carrying the prokaryotic methylase gene, as well as the two chromosomal genes tested (his3 and leu2) were methylated, whereas the bulk of the yeast DNA remained largely unmethylated. This indicates that the Bacillus sphaericus modification methylase was expressed in yeast but it modified only certain parts of the yeast DNA.  相似文献   

20.
基于独立分量分析的普适人脸识别系统   总被引:1,自引:0,他引:1  
在模式识别领域,变量间的高阶统计关系开始受到更多关注.但目前许多人脸识别系统一方面依赖二阶统计关系,另一方面又需先采用主分量分析技术对样本进行降维.主分量分析技术自身却对二阶统计关系敏感,因此需要寻找一种对高阶统计关系敏感的算法作后续处理.为此作者提出了一种基于独立分量分析的普适人脸识别系统,并与传统的基于Fisher线性判别规则的人脸识别系统进行了比较分析,重点讨论在光照方向大幅度变化和人脸图像不完整情况下两种系统性能的优劣.理论分析和实验结果均证实,在这两种情况下,基于独立分量分析的普适人脸识别系统的性能优于传统的基于Fisher线性判别规则的人脸识别系统的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号