首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
PageRank-Pro: 一种改进的网页排序算法   总被引:9,自引:1,他引:8  
根据网页点击信息改进了原有的PageRank算法, 利用Seidel迭代算法加快了迭代收敛 过程. 实验结果表明, 改进后的迭代算法效率提高23%左右.  相似文献   

2.
白连红  徐澍 《科技信息》2009,(24):201-202
本文提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的多支持度的关联规则方法,并结合具体数据进行了分析。改进了算法,在实践中可以有效地提高系统数据挖掘的效率。  相似文献   

3.
针对种子填充算法程序存在的重复入栈以及对一类连通区域不能进行正确填充的问题,提出了改进方法:修改入栈顺序来解决重复入栈问题,修改入栈数据结构添加标志数组来防止对某条线重复扫描,改进算法对种子所在扫描线分上下两个区域进行分别逐行扫描;提出扫描线种子填充算法的改进算法,对非空的凸形区域特殊情形给出了单独的算法,使填充速度得到很大提高。  相似文献   

4.
给出低熵情况下的多键排序改进算法.利用众数投票算法结合中位数选择算法产生枢纽元,对与枢纽元相等的元素使用改进算法,其他元素仍采用原算法.理论分析表明,重复数据较多时改进算法速度较快,且在数据量不大时其性能接近线性算法.  相似文献   

5.
基于约束的关联规则挖掘是针对特定约束的规则的挖掘,挖掘的结果有着更好的针对性和实用性,Separate算法是现有的效果较好的算法,但有2点不足:未修剪生成的候选集和候选项重复生成。对此该文提出了改进的SeparateP算法,算法中加入了对候选集的修剪,并且利用了项集重复生成的信息,使候选集的修剪更加有效快捷。实验表明,改进算法显著提高了原算法的效率。  相似文献   

6.
针对重复数据检测过程中增量数据重复值检测问题进行分析,在基本近邻排序算法基础上,提出增量近邻排序比较算法。该算法通过跳动窗口形式比较相邻数据,大大减少了数据比较次数;同时引入MapReduce模型对该算法加以改进以提高其海量数据处理的能力。实验表明,改进后的增量近邻排序比较算法在保证检则结果准确的前提下,能够有效提高增量数据重复检测的速度,并且算法具有较高的稳定性,更适应海量数据环境中重复数据检测任务。  相似文献   

7.
符于江 《科技信息》2012,(26):162-163
重复网页检测的关键问题是如何有效地提取相似网页内容的特征并对特征进行相似度比较。本文概述了重复网页的定义、检测流程,对重复网页的特征提取方法和比较算法进行了分析,并对目前常用的基于特征的检测算法进行了比较,总结了当前常用特征提取和比较算法的不足和需要改进之处。  相似文献   

8.
针对一个Pareto局部搜索(PLS)算法在解决多目标组合优化问题中所得到的解集与初始点的选取有关,提出该算法的改进。改进算法从初始解开始进行PLS搜索产生一组改进解集VF,然后对VF中的所有解再进行PLS搜索,如此重复直到满足终止条件。实例计算表明,PLSⅠ算法和算法Ⅱ能得到很好的解且解的质量优于PLS算法。  相似文献   

9.
采用文献[11]求解子串前缀的方法,给出了BM算法一个改进算法。改进算法最坏情况下的时间复杂度达到O(m*n/k),有效地减少了字符重复比较的次数,提高了匹配效率。  相似文献   

10.
基于AOS格式的扩展Chan-Vese模型及多水平集图像分割方法   总被引:1,自引:0,他引:1  
对Chan-Vese提出的基于Mumford-Shah模型的多水平集图像分割算法作了改进.首先,使用AOS算法改进了原模型的差分格式,使得差分格式无条件稳定.其次,在水平集的构造中应用了快速推进法的改进算法,减少了水平集初始化时计算的点数和重复次数.  相似文献   

11.
针对传统教科书中的图着色算法进行了分析研究,通过对算法执行步骤的跟踪分析,提出了两点改进方法,从而省去了大量的重复计算,大大提高了算法的效率.  相似文献   

12.
基于Levenshtein算法的题库相似度检测算法的设计与改进   总被引:1,自引:0,他引:1  
为快速找到题库中题干重复题或相似度很高的试题,利用java Excel API类配合Levenshtein Distance算法实现直接访问excel题库,设计了题库重复题检测算法。在实际使用过程中发现Levenshtein算法存在内存超限,检测结果输出越界等问题,采用字符串分割法及增加控制语句的方式进行改进,获得了良好的实际使用效果。  相似文献   

13.
针对Sunday匹配算法在首字符和正文存在大量重复,使得其平均执行效率降低这一问题,提出了一种改进的Sunday算法。首先将重复的首字符压缩为一个字符,然后使用压缩后的字符串和正文进行匹配,若匹配成功,对成功匹配的位置信息前的字符和首字符进行循环匹配;如果匹配位数和模式串相同,则返回成功,否则返回失败。改进后的算法大大减少了匹配次数,使执行速度有了明显的提高。  相似文献   

14.
水平集算法是一种解决曲线演化问题的有效方法,它能够解决一般方法难以处理的拓扑结构变化问题。在水平集算法中,跟踪曲线经过一步演化后的当前位置是一个很重要的步骤,它直接关系到下一次演化计算的精确程度,以往采用的跟踪算法一般是步进方格(Marching Square)算法,这种算法中存在计算重复问题。本文根据图像中曲线跟踪的特点,改进了步进方格算法,减少了其中的重复计算。实验表明,这种改进的算法具有简单实用的特点。  相似文献   

15.
平面区域简单种子填充算法的改进   总被引:2,自引:0,他引:2  
介绍了对计算机图形学中平面区域简单种子填充算法的改进,解决了该方法的同一个种子重复入栈的问题,节省了内存,加快了算法速度。  相似文献   

16.
分析了典型的聚类算法及其适用范围,针对其处理Web点击流数据的不足,提出了一种用于Web点击流的增量挖掘的聚类算法WCSCluster,给出了相关定义及存储结构,并用实例说明了算法的运行过程.最后对比同类算法给出实验结果.实验结果表明该算法具有良好的性能,能够发现更优的簇.  相似文献   

17.
研究了不确定的有限自动机转换为与之等价的确定的有限自动机的算法机制和复杂性,以及传统的子集算法在转换过程中存在的大量重复遍历和无效遍历现象,并针对上述现象提出了一种改进的子集法算法MF-SUBSET.结果表明,MF-SUBSET算法通过增加状态标志和遍历路径标志来决定当前的搜索策略,能够有效地避免转换过程中的重复遍历和无效遍历操作,极大地提高了转换效率.  相似文献   

18.
扩充堆栈结构的种子点区域填充算法   总被引:11,自引:0,他引:11  
采用扩充填栈结构的方法,对已有的扫描线种子点区域填充算法进行改进,改进后的新算法在几何上的填充单连通区域时避免了任何重复操作,对几何上的多连通区域仅需要复检查少量的像纱,使扫描线种子点区域填充算法臻于完善,最后给出了新算法的类C语言的算法描述和说明。  相似文献   

19.
由于NSGA-Ⅱ引入了精英策略,为保留父代中优秀个体直接进入子代,在每一代将父代和子代所有个体混合后再选择新种群,所以在新种群中很容易产生重复个体.而进化种群中出现重复个体意味着搜索区域的重叠,使得算法探索新可行区域的效率降低.考虑到计算复杂度和增强解集的有效性,提出了一种删除策略对NSGA-Ⅱ算法进行了改进.算例表明该改进算法能获得分布更加均匀的解集,且具有更强的稳定性.  相似文献   

20.
利用XML文档中各路径之间相似的特点,只扫描一次XML文档,把重复的XML标记所生成的事件组合成一个聚合事件,并在基于共享前缀的NFA算法YFilter基础上,提出一种改进算法PolYFilter,实现了聚合事件的谓词计算.实验表明,与YFilter相比,PolYFilter算法减少了大量相同的有限自动机状态转移的中间状态,避免了状态集的重复计算.特别是当XML文档比较大,且重复标记比较多的时候,PolYFilter有较好的过滤性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号