首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 84 毫秒
1.
提出了一种客观的特征提取和相关的方法用于DNA序列的结构分析.这种方法是从DNA序列码的碱基和片段码中提取统计特征和相关特征.然后计算样本序列和已知类之间的平均相关系数.如果最大的相关系数大于对应类的平均相关系数,则该样本被分类到对应的类中去.利用一组DNA序列样本做了试验,结果表明,这种方法适合于任何DNA序列的结构分析而不需要先念的生物信息,对发掘人类基因隐藏信息的研究大有用处。  相似文献   

2.
本文提出了一种比较DNA序列的方法,对于通过数学方法提取出的含有DNA序列信息的多种数值特征构成的向量,设计了一种新的聚类算法,使其能对一组向量进行有效分类从而达到对DNA序列进行比较的目的.为了避免传统算法的缺陷和增加达到分类最优解的概率,我们将遗传算法引入进来,提出了一种基于遗传算法的聚类算法.一组对八种有胎盘哺乳动物的线粒体全基因组序列的分类实验验证了该方法的有效性.  相似文献   

3.
基于小波变换和支持向量机的图像分类   总被引:1,自引:0,他引:1  
提出了一种基于小波变换和支持向量机的图像分类新方法,该方法利用小波变换进行图像特征提取,利用支持向量机进行图像分类,并与基于图像底层特征的分类方法进行了实验比较.实验结果表明该方法具有较好的分类性能.  相似文献   

4.
为了提高利用Gabor特征进行人脸识别的识别率和鲁棒性,文章提出了一种新的视频流人脸识别方法.首先根据人脸不同位置特征点的识别能力不同,选取对识别贡献比较大的眉毛和眼睛部位进行特征提取;然后根据不同特征点Gabor特征的分类能力,采用加权相似值和相似性投票相结合的方法进行视频流人脸识别.实验结果表明,该方法比传统方法具...  相似文献   

5.
提出了一种新的基于部分连接神经网络的自然场景图像分类方法.运用该方法对图像进行模式识别时,不必进行特征提取,而是将整个图像输入神经网络,由神经网络在训练中透明地选择和识别特征.由于大型图形处理器(GPU)并行处理系统的运用,使得神经网络演化速度大大加快,弥补了该方法计算量大的弱点.实验结果表明,利用部分连接神经网络进行场景图像分类,与利用特征提取后再识别场景的分类方法比较,在总识别率上大体相当;但不必进行特征提取,而且速度很快.并且,还运用了插值和延拓两种方法来对图像进行尺寸调整,使得神经网络可以训练和识别不同大小的场景图像.  相似文献   

6.
为提升车辆在自然界地面上行驶时利用悬架振动响应识别地面类型的分类准确率,提出将时域参数特征和小波包能量特征相结合的特征提取方法,利用概率神经网络(PNN)对地面进行分类,对比了时域参数特征、小波包能量特征及两者结合的分类效果.试验中,使用道路模拟试验台输出6种路面时域高程,将单轴加速度传感器安装在车辆悬架摆臂上,采集垂向加速度信号.结果表明,使用提出的特征提取方法可以取得良好的分类效果,平均分类准确率达到了91.3%,明显优于其它两种方法.   相似文献   

7.
为了提取有效的损伤特征并提出实用的损伤识别方法,本文利用核主元分析(KPCA)良好的非线性特征提取和支持向量机(SVM)在非线性映射、分类方面的优秀性能,提出了一种基于非线性特征提取的支持向量机损伤识别方法.首先采用粒子群算法(PSO)来优化KPCA的核参数,然后运用优化后的KPCA进行损伤特征提取,最后用SVM进行模式分类并输出识别结果.为了验证所提方法的有效性,通过一个12层钢混框架模型进行损伤识别,并重点研究了KPCA的核参数优化模型及可分性分析、噪声程度、不同特征提取方法、神经网络模型对该方法性能的影响.研究发现:本文所提出的方法不仅能有效地提取损伤特征和降低数据维数,而且具有较高的损伤识别和抗噪能力、泛化能力,且鲁棒性很强.  相似文献   

8.
在常见的特征提取方法中,Fisher判别分析(Fisher Discriminant Analysis,FDA)只能提取线性特征,基于核的方法具有提取非线性特征的能力,但对核函数类型及其参数十分敏感. 文中研究如何有效提取数据特征,提出了一种基于多层自动编码机(Stacked AutoEncoders,SAE)和Fisher标准的特征提取算法,该算法中所使用的深度学习网络模型在训练过程中结合无监督特征提取SAE以及有监督的特征提取FDA. 通过与多层自动编码机、极限学习机(Extreme Learning Machine,ELM)等模型提取的特征进行对比,在数据集Pendigits、mnist、ORL和AR上利用支持向量机对数据特征进行分类,结果表明基于SAE的Fisher变换(FDA-SAE)在分类结果准确率以及分类时间上都有较好的效果. 特别是在小数据集AR上,当样本特征较少的情况下效果非常明显.  相似文献   

9.
针对区分两种不同运动想象(想象左手运动和想象右手运动)的脑-机接口任务,提出了以小波方差作为分类特征的方法.首先深入研究了小波变换以及小波方差的计算方法,结合验证脑电图(EEG)存在的ERD/ERS现象,然后利用小波分解系数方差对C3,C4导联脑电信号进行特征提取,最后采用最简线性分类器进行分类,采用分类正确率作为主要评价标准.结果表明,最大分类正确率为85%,最佳分类时间段为4~6.5 s.与BCI竞赛和其他方法相比,在保证分类正确率的前提下,所使用的特征提取和分类方法更加简单,具有较高的参考价值.  相似文献   

10.
为解决现有恶意代码检测方法存在的特征提取能力不足、检测模型泛化性弱的问题,提出了一种基于Windows API调用序列的恶意代码检测方法.使用N-gram算法和TF-IDF算法提取序列的统计特征,采用Word2Vec模型提取语义特征,将统计特征和语义特征进行特征融合,作为API调用序列的特征.设计了基于Stacking的三层检测模型,通过多个弱学习器构成一个强学习器提高检测模型性能.实验结果表明,提出的特征提取方法可以获得更关键的特征,设计的检测模型的准确率、精确率、召回率均优于单一模型且具有良好的泛化性,证明了检测方法的有效性.  相似文献   

11.
多标记学习降维方法在实际应用问题中用以处理特征,标记或二者维度较高的数据集,已成为研究热点;针对目前多标记学习降维方法数量众多,种类繁杂而导致缺乏科学分类的问题,从多标记数据降维空间选择的角度,提出将多标记学习降维方法按照特征空间降维,标记空间降维和二者均降维的形式归纳为三类,其中特征空间降维又分为特征降维和特征选择两类问题,分别从独立于和依赖于彼此空间的角度对已有的40余篇文献中的典型多标记学习降维算法的研究现状进行了综述;最后,总结了多标记学习降维方法的研究现状和启示,并提出了未来进一步的研究方向。  相似文献   

12.
多标签特征选择能够有效去除冗余特征并提升分类精度, 是解决"维数灾难"问题的有效方法. 然而, 已有的多标签特征选择算法是对所有标签选择出相同的特征, 忽略了标签与特征之间的内在联系. 事实上, 每个标签都具有反映该标签特有属性的特征, 即类属特征. 提出一种基于图拉普拉斯的多标签类属特征选择(multi-label label-specific feature selection based on graph Laplacian, LSGL)算法. 对于每个类别标签, 基于拉普拉斯映射获得数据的低维嵌入, 再通过稀疏正则化获得数据空间到嵌入空间的投影矩阵, 接着通过分析矩阵系数确定每个标签相应的类属特征, 最后使用类属特征进行分类. 在 5 个公共多标签数据集上的多标签特征选择与分类实验结果证明了所提算法的有效性.  相似文献   

13.
Feature selection methods have been successfully applied to text categorization but seldom applied to text clustering due to the unavailability of class label information. In this paper, a new feature selection method for text clustering based on expectation maximization and cluster validity is proposed. It uses supervised feature selection method on the intermediate clustering result which is generated during iterative clustering to do feature selection for text clustering; meanwhile, the Davies-Bouldin's index is used to evaluate the intermediate feature subsets indirectly. Then feature subsets are selected according to the curve of the Davies-Bouldin's index. Experiment is carried out on several popular datasets and the results show the advantages of the proposed method.  相似文献   

14.
针对现有大多数多标签特征选择算法未能有效去除特征空间冗余特征,同时也忽略了标签差异性的现状,提出一种基于相关性分析的多标签特征选择方法,利用特征之间的相关度对特征进行分组,解决了特征之间的相关性问题.根据样本所对应的标签属性对样本做一个正负类的聚类,对于正样本和负样本所构成的正类簇和负类簇单独确定其聚类个数,并计算原特征到正负类簇中各个类中心的距离,如此便产生了标签特定特征空间;将标签共享的特征空间和标签特定特征空间融合,考虑到多个标签之间的个性和关联性,解决了标签的差异性问题.实验测试表明,相较于现有的多标签特征选择算法,提出的基于相关性分析的多标签特征选择方法在各个分类指标上均有较优的表现,充分证明了该方法的有效性.  相似文献   

15.
现有过滤式特征选择模型采用贪心策略结合互信息评价特征子集,容易陷入局部最优陷阱.考虑标签信息对冗余度的影响,利用一种改进的MIFS-U方法在给定标签的条件下衡量冗余度,采用基于分解的多目标优化框架结合引入多项式突变的差分进化算子进行全局搜索,避免搜索陷入局部最优.引入l1正则化项来保证特征子集的稀疏性,并提出了新的特征选择算法MOEA/D-DEFS.实验阶段使用knn-5分类器来验证学习效果,并在多组来自不同领域的数据集上进行测试.结果表明,将特征选择视为多目标问题采用全局搜索策略搜索可以在特征子集维度和分类准确性方面提供更好的性能.  相似文献   

16.
现有大多数多标记流特征选择算法在进行特征选择时,往往忽略标记间的相关性,易导致算法预测精度的下降。为解决这一问题,提出一种结合邻域信息和标记相关性的在线多标记流特征选择算法;定义自适应邻域关系解决邻域粗糙集的粒度选择问题,将其推广到多标记学习中;利用互信息计算标记间的相关性得到标记权重;通过邻域粗糙集和标记权重评估特征和标记间的相关性,并设计特征在线重要度分析、在线相关性分析和在线冗余度分析3种指标,以实现在线评价动态候选特征。在7组多标记数据集以及5个评价指标上的实验结果表明,所提算法综合性能较优。  相似文献   

17.
A D Ellington  J W Szostak 《Nature》1992,355(6363):850-852
We have isolated a set of ligand-binding DNA sequences from a large pool of random sequence DNAs by selection and amplification in vitro, using similar methods to those described for the isolation of ligand-binding RNAs. The ligand-DNA interactions are both sequence- and ligand-specific, and are dependent on proper folding of the single-stranded DNA. Some ligands led to the isolation of more DNA sequences than RNA sequences, and vice versa. Analysis of individual sequences reveals that ligand binding is DNA-specific; RNAs of identical sequence could not interact with the same ligands. Ligand-binding DNAs might be more suitable than RNAs as potential pharmacological reagents because of the greater stability of DNA. The apparent primacy of RNA in the early evolution of life may have been due to its availability rather than to its functional superiority.  相似文献   

18.
DNA splice site sequences clustering method for conservativeness analysis   总被引:1,自引:0,他引:1  
DNA sequences that are near to splice sites have remarkable conservativeness, and many researchers have contributed to the prediction of splice site. In order to mine the underlying biological knowledge, we analyze the conservativeness of DNA splice site adjacent sequences by clustering. Firstly, we propose a kind of DNA splice site sequences clustering method which is based on DBSCAN, and use four kinds of dissimilarity calculating methods. Then, we analyze the conservative feature of the clustering results and the experimental data set.  相似文献   

19.
在监督学习实际任务中,特征的高维性、标记的动态性和缺失性为监督学习带来严峻的挑战。为解决这些不足,提出流缺失标记环境下的多标记特征选择算法。首先,为解决缺失标记的影响,通过学习标记相关性填补不完整的标记矩阵。其次,利用稀疏学习方法为每个新到达的标记选择类属属性。然后,根据已到达标记的类属属性,通过计算得分选取一个有代表性的特征子集。最后,在11个基准数据集上进行一系列实验表明,所提算法能选择有代表性的特征子集,且分类性能较优。  相似文献   

20.
Most DNA shuffling methods currently used require PCR process. A novel method of DNA shuffling without PCR process is described, taking advantage of the feature of some restriction enzymes whose recognition sites differ from their cleavage sites, thus giving rise to different cohesive ends. These cohesive ends can be rejoined at their native sites from different parental sequences, generating new sequences with various combinations of mutations.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号