首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.  相似文献   

2.
带约束最长公共子序列快速算法   总被引:2,自引:0,他引:2  
带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共子序列问题转换为带约束最小覆盖集问题,并建立带权的ref树结构,构造包含约束序列的约束覆盖子集,约简带约束覆盖子集并从中搜索关键路径,再通过关键路径构造CLCS,该算法将算法时间复杂度提升到O(nlogn+(q+r)L),r是约束序列的长度,q是两序列序偶的个数,L是两序列的最长公共子序列(LCS)长度.  相似文献   

3.
利用动态规划法求出二维数组的情况下,使用矩阵搜索的方法求出所有分支,从而求出所有最长公共子序列的算法.该算法将通常认为的指数量级的时间复杂度降低到了max{O(cmn),O(ck)}.随后对此算法的正确性以及效率做了证明.  相似文献   

4.
基于滑动窗口最长公共子序列Wi Fi指纹定位算法   总被引:1,自引:0,他引:1  
针对基于Wi Fi瞬时指纹定位算法中由于RSS信号的时变特性引起的Wi Fi定位精度差问题,提出了一种基于滑动窗口最长公共子序列指纹定位算法.该算法将时间序列的RSS信号指纹转化为基于滑动窗口的数据模型,增加了指纹特征信息,提高比对准确性.通过计算请求定位数据与样本的最长公共子序列来获得样本点的相似性,解决由于窗口伸缩或滑动窗口中个别采样点无信号引起的比对不准确问题,从而提高了定位的精确性和鲁棒性.实验结果表明,所提定位算法的结果明显优于瞬时指纹定位算法.  相似文献   

5.
从文本相似度和结构相似度算法入手,对面向作者消歧和科研合作预测领域的作者相似度算法进行了研究。分析和比较了各种常用算法的优劣,以及目前的应用情况,并对作者相似度算法进行系统梳理与展望.  相似文献   

6.
基于语义相关度计算的汉语词义消歧方法研究   总被引:1,自引:0,他引:1  
词义消歧(WSD)一直是自然语言处理(NLP)研究的重点和难点之一.本文以语义资源-《知网》为基础,从语义角度出发,抽取《知网》中义原之间的多种复杂关系,结合词性、词语组合等信息,提出一种基于相关度计算的汉语词义消歧方法.实验结果表明,该方法对于处理汉语WSD是有效的.  相似文献   

7.
本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.  相似文献   

8.
现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkler和最长公共子序列相结合,以提高匹配的精度。最后通过实验进行了验证,结果表明该算法与传统相似度算法相比具有较高的适配性和鲁棒性,可以为装备数据聚合工作提供有效支撑。  相似文献   

9.
维吾尔语是典型的资源稀缺型语言,由于词义消歧标注语料资源和语义分析工具的不足,导致传统的有监督方法难以实现.针对该问题,将篇章文本的词义消歧问题类比为文本主题分类问题,在LDA(latent Dirichlet allocation)主题模型的基础上提出了一种维吾尔语无监督词义消歧模型.为强化主题模型对歧义词语义项的分类性能,加入了3个数据预处理过程:去除停用词,过滤有效词和强化同义词词频权重.实验结果表明,在随机抽取的63组测试样本集中,该模型的词义消歧准确率达到65.08%,在篇章文本采样词任务中词义消歧准确率达到61.2%.  相似文献   

10.
基于多特征融合的同名专家消歧方法研究   总被引:1,自引:0,他引:1  
针对专家库构建过程中出现的同名歧义现象,提出一种基于多特征融合的同名专家消歧方法。从中国知网(CNKI)数据源中获取专家的论文信息,抽取论文的标题、摘要、关键词、作者单位和合作者等关键信息,并将其作为属性特征,构建特征表示模型,进而定义同名专家之间的相似度计算函数。根据计算得到的相似度,将同名消歧问题转化为聚类问题。利用近邻传播聚类算法进行聚类,解决同名消歧问题。在采集的专家论文数据上的实验表明,基于多特征融合的同名专家消歧方法的准确率可达92%,取得良好的消歧效果。  相似文献   

11.
给出求2个字符串最长公共子串(LGS)长度的递归算法、递推算法和心动阵列算法。对2个长度分别为n,m(n≥m)的字符串,递归算法的最坏时空复杂性为(m n)!/(m!n!),而递推算法的时空复杂性分别仅为m nm 0(1),2m 0(1)。在心动阵列算法中,需m个PE和n m的时间,最后给出了一个应用实例。  相似文献   

12.
由于人的重名现象,人名检索的结果往往是同名的不同人物实体相关网页的混合。重名消解是根据上下文来区分同名的不同人物实体的过程。本文提出了基于相关社区的重名消解方法,采用改进的Espresso算法进行相关社区发现。将每个网页发现的社区应用到两阶段重名消解算法中,并且在WePS-2测试集上进行试验。实验结果表明了该方法的有效性。  相似文献   

13.
实体排歧一直是信息抽取任务中的难点问题.传统的方法常常借助语言知识库来进行排歧,如WordNet等.但是这类方法存在着一个问题,就是很难对人名以及最新的词汇进行排歧.因此,本文利用当前流行的维基百科知识库中的排歧页对同名实体进行排歧处理,提出基于维基百科的实体排歧方法.实验显示该方法能够有效的对人名进行排歧处理并且效果显著.  相似文献   

14.
 蛋白质多序列比对是一种重要的生物信息学工具,在生物的进化分析以及蛋白质的结构预测方面有着重要的应用。各种比对算法在这个领域都取得了很大的成功,但是每种算法都有其固有的缺陷。提出置换距离法,对当前流行的几种蛋白质多序列比对算法进行对比评价。由于置换距离法仅关注于不同蛋白质间进化距离的相对次序,而不考虑这些进化距离之间的细微差异,因而得到的评价结论更具有鲁棒性。另外,采用最长公共子序法度量置换距离可以比较准确的反映不同置换之间的差异性。基于该算法,对Dialign, Tcoffee, ClustalW和Muscle多序列比对算法进行了性能评估。  相似文献   

15.
基于ALCSL&LS核函数的支持向量机签名认证   总被引:3,自引:0,他引:3  
提出一种名为ALCSL&LS的核函数来描述签名动态信息之间的相似性.ALCSL&LS核函数利用自适应最长共同子序列的长度,不仅描述了签名动态信息整体上的趋势相似性,而且选择性的描述了某些重要的特征局部在时间弯曲校正后的相似性,并将两者融合生成核矩阵.该核函数具有相似性描述直观、对噪音具有的鲁棒性和易于实现等优点,它核化的支持向量机实现了签名原空间上的非线性划分.基于此方法的签名认证实验获得了比较满意的结果.  相似文献   

16.
提出一种名为ALCSL&LS的核函数来描述签名动态信息之间的相似性. ALCSL&LS核函数利用自适应最长共同子序列的长度,不仅描述了签名动态信息整体上的趋势相似性,而且选择性的描述了某些重要的特征局部在时间弯曲校正后的相似性,并将两者融合生成核矩阵. 该核函数具有相似性描述直观、对噪音具有的鲁棒性和易于实现等优点,它核化的支持向量机实现了签名原空间上的非线性划分. 基于此方法的签名认证实验获得了比较满意的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号