首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.  相似文献   

2.
大部分时间序列数据分析的一个重要组成部分是相似性度量方式.在众多相似性度量方式中,基于最长公共子序列的相似性度量方式是一种常用的有效方法,但该方法仅仅度量序列点对点的数值差异,而忽略了序列的变化趋势.为此提出一种基于趋势信息的时间序列离散化方法并用最长公共子序列进行相似性度量.该方法能够很好地度量时间序列的趋势信息.此外,还将其与现有的点对点函数线性结合.与现有相似性度量方法不同,该方法能同时考虑时间序列的趋势信息和函数距离,相似性度量方案运用最近邻分类算法规则进行分类.为了进行全面的比较,在42个时间序列数据集上测试该算法的有效性.实验结果表明,所提出的方法能有效提高时间序列分类准确率.  相似文献   

3.
时间序列的相似性度量是时间序列聚类、分类以及其他相关时间序列分析的基础.传统基于距离的相似性度量方法,忽视了时间序列可能存在的时间上的联系,而将时间序列看作一系列孤立点的集合.对于序列间可能存在的前后联系,基于分数阶微分的遗传特性和记忆特性,提出一种新的时间序列聚类的相似性度量.根据时间序列的分数阶微分计算新序列间的点距离,将其作为聚类算法的输入对时间序列进行聚类.仿真实验结果表明,与基于原始序列矢量距离的聚类结果相比,新的分数阶相似性度量方法表现更好.  相似文献   

4.
基于全序列比对相似度预测信号肽   总被引:1,自引:0,他引:1  
针对信号肽预测问题,提出采用全序列比对度量序列相似度,以避免以往算法借助滑动窗将整个氨基酸序列分割成等长序列片断所导致的信息丢失及不平衡样本等问题.在此基础上证明基于全序列比对的相似度可嵌入欧式空间,进而借助支持向量机(SVM)进行分类预测.在目前广泛应用的Neilsen数据集上进行实验并与相关结果比较,结果表明所提出的算法确实可以保证稳定的高预测率.  相似文献   

5.
针对现有的距离度量方法度量准确度低且计算效率低的问题,提出了基于形态拟合的距离度量算法.该算法使用滑动聚集平均近似方法对序列进行分段降维处理,计算降维后的分段序列的动态弯曲路径,并计算处于动态弯曲路径上的分段序列之间的欧式距离,以所有分段序列的欧式距离的累积值作为最终的距离计算结果.实验表明基于形态拟合的距离度量算法具有度量准确度高且计算效率高的优点.  相似文献   

6.
为获得锥内部为空的特殊锥度量空间中序列的收敛性概念,以及这类锥度量空间的度量化,利用锥的正规性,通过锥中收敛于零元的向量序列定义了收敛序列、柯西序列和完备;为得到这类锥度量空间的度量化问题,利用控制锥度量的向量的范数的下确界定义了一种由锥度量诱导的实度量.证明了锥内部为空的锥度量空间中的序列收敛、柯西序列和相应的空间完备与诱导的实度量定义的序列收敛、柯西序列和相应的空间完备是等价的,即得到了锥内部为空的锥度量空间的一种度量化.作为应用,利用修改距离函数,证明了这种特殊锥度量空间中的一个不动点定理.  相似文献   

7.
分别基于Markov链模型、频率分析和加权Markov链模型分析k-mer(主要考虑k=6的情形)在DNA序列中的使用情况,并以此定义模糊相对熵度量2个DNA序列结构的差异程度.将转录频率较低的启动子序列作为对照,分析其它转录频率不同的酵母基因启动子序列与对照序列中k-mer隶属度的模糊相对熵的变化,发现基因转录频率与模糊相对熵存在线性正相关关系.一般地,转录频率相差越大的基因,其启动子序列结构的差异越明显.这提示酵母基因启动子序列结构与基因转录频率有一定关联性.与Markov链模型和频率分析法比较,加权Markov链模型的模糊相对熵能更有效地度量基因启动子序列结构的差异.  相似文献   

8.
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.  相似文献   

9.
现有研究集中于不带有时间空间信息或带有固定时间空间信息的活动序列相似度计算,没有从不同层次来度量用户行为序列的相似性,为了实现对用户行为多粒度多视角的动态认知,提出一种基于序列比对算法Needleman-Wunsch的多粒度时空序列比对算法(multi-granular spatiotemporal sequences alignment,MGSSA),扩展了NW算法的得分函数以结合时间、空间信息,通过粒度调控实现了从不同的粒度来计算时空事件序列的相似度.实验证明,多粒度时空序列比对算法MGSSA是有效且可行的.   相似文献   

10.
将序列数据的相似度度量方法S3M引入蚁群聚类算法中,提出一种基于序列相似性的蚁群聚类算法。该算法既继承了蚁群聚类算法原有的优点,又能有效地对序列数据聚类,更适合处理序列数据。  相似文献   

11.
利用粗糙集、知识库的理论引入了粒度、结构差离度、贴近度、中心差离度、边缘差离度等的概念,给出了数据集之间的距离公式.利用距离公式,分析了数据集之间的分类及识别问题,为计算机中的数据集分类、识别提供了又一有力的方法.  相似文献   

12.
p-平均对称差度量的Cauchy问题(Ⅰ)   总被引:2,自引:2,他引:0  
从集合的对称差集合的Lebesgue 测度出发,建立了衡量Fuzzy 数之间差异的p-平均对称差度量dΔp ,讨论了(E,dΔp)中的Cauchy 序列的基本性质。  相似文献   

13.
根据图像灰度的联合概率分布函数与图像相似程度之间的变化规律,分析了Shannon互信息与Kullback-Leibler距离之间的关系,利用变量间的不等式关系理论,提出基于Minkowski不等式的广义距离度量,并构造了基于这一距离的多模态图像配准新测度.新的配准测度不再要求概率分布必须满足连续性的要求,实验中使用MR和PET医学图像进行了实验分析.结果显示,基于Minkowski距离的新配准测度比传统的信息论测度具有更强的噪声鲁棒性,用乘方运算代替了对数运算,数学表达式更简单,并省去了除法运算,在算法上也更容易实现.  相似文献   

14.
主要研究函数序列测度收敛的性质,包括测度收敛的等价子列刻画;在可列个可测集上均测度收敛的序列在并集上未必测度收敛的反例以及使其成立的一个充分条件;测度收敛意义下积分序列极限的三大定理等.  相似文献   

15.
目的分析羚牛分子系统进化,解决多年来关于羚牛分类地位及其与麝牛关系的争论。方法应用聚合酶链式反应(PCR)分别扩增羚牛、绵羊、山羊细胞色素b基因,并对其全序列(1140bp)进行测定。结合GenBank检索序列,对9种偶蹄类动物(麝牛、绵羊、羚牛等)、1种奇蹄类动物(斑马)的细胞色素b基因序列差异进行分析,并基于序列差异构建分子系统树。结果羚牛与羊亚科的动物亲缘关系最近(序列差异分别为9.085%和11.652%),与其他动物亲缘关系较远(序列差异为12.344%~23.333%),与麝牛的差异达到了13.658%。羚牛与绵羊分歧的时间约在360万年前,而与麝牛的分歧时间约在550万年前。结论将羚牛归入羊亚科较为合理,羚牛和麝牛形态和行为上很强的相似性可能是趋同进化的结果。  相似文献   

16.
混沌集的不变概率测度   总被引:1,自引:0,他引:1  
证明紧度量空间的极小映射以及拓扑熵为零的区间映射不存在具有非零不变概率测度 的混沌子集,特别不存在具有非零不变概率测度的序列分布混沌子集。  相似文献   

17.
Introduction  Discrepancyanddispersion,thetwowell-knownmeasuresfortheirregularityofdistributionofpointsets,playacentralroleinQuasi-MonteCarlo(QMC)methods.Theyarecriteriaforchoosing“good”pointsetsinQMCmethods.Eachhasitsspecialapplications.Thediscrepancycriterionisparticularlysuitablefortheintegrationproblemandforexperimentaldesign.Thedispersioncriterionisespeciallyusefulinstudyingglobaloptimizationproblems.Manyauthorshaveextensivelystudiedtheproblemofhowtobestconstructlowdiscrepancyand…  相似文献   

18.
在有限状态空间中取值的随机变量序列,假设它在概率测度P下是一非齐次马氏链,在概率测度Q下是一齐次马氏链,利用非齐次马氏信源的渐近均分割性,齐次马氏信源的渐近均分割性及随机变量序列的一致可积性,给出了马氏过程散度的极限存在条件,并得到了马氏过程散度的极限的值,在此基础上将马氏过程散度的极限存在条件推广到了高阶马氏过程的情形,同时也给出了高阶马氏过程散度的极限的值.  相似文献   

19.
对比数列与其子列之间敛散性的关系,总结了一些级数与其子级数之间敛散性的关系.  相似文献   

20.
分析了影响Vague集相似度量的因素,并充分考虑了未知度对Vague集相似度量的影响,提出了一个新的Vague集相似度量方法,证明该方法满足相似度量的基本准则,通过分析影响相似度量的因素,探讨了现有Vague集相似度量方法存在不足之处,与现有相似度量方法比较证明新的相似度量方法能够有效和合理的区分数据,具有一定的优越性,最后在模式识别的应用实例中,给出了该相似度量方法的模式识别应用过程,实验结果表明了该方法的实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号