首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
考虑加权排序的分类数据聚类算法   总被引:1,自引:0,他引:1  
针对部分聚类算法对数据输入顺序敏感的问题,定义了不干涉序列指数,提出了应用不干涉序列指数对分类数据进行加权排序的方法,并基于该方法对受数据输入顺序影响的CABOSFV C分类数据高效聚类算法进行改进,提出了考虑加权排序的聚类算法(CABOSFV CSW),消除了算法对数据输入顺序的敏感性.采用UCI基准数据集进行实验,发现应用加权升序排序的CABOSFV CSW算法在处理分类数据时,聚类质量较原始CABOSFV C算法和其他受数据输入顺序影响的算法在准确性上有改善,在稳定性上有显著提高.  相似文献   

2.
基于现有排序算法的缺陷,提出了对大型数据库排序算法智能化的改进方案:定义了“有序度”函数描述待排数据的特点,并自适应地选择相应排序算法,极大地提高了对大量数据进行排序的效率.提出的新算法在一般情况下与“快速排序”效果相当;但在较差情况(待排数据基本上有序)下,效率则显著提高,是一种极具实用价值的算法.  相似文献   

3.
本文提出一种新的基于有序双端链表的比较排序算法,即ODListsort(ordered double-end linked list sort)算法。该算法首先要定义一个可共存的链表最大数量,然后通过生成链表、根据规则插入数据以及合并操作来对数据集进行排序。在ODListsort算法中,数据元素是以链表形式进行动态内存分配的,因此它比一些经典的排序算法性能更优。实验结果表明,对于随机数据集,ODListsort排序与快速排序的速度接近,比归并排序、选择排序、插入排序以及冒泡排序的速度更快;对于有序数据集,ODListsort排序的效率远超快速排序,略高于归并排序。  相似文献   

4.
数据等概率分档统计插入排序算法   总被引:1,自引:1,他引:0  
提出了一种按数据等概率分档的排序算法,此算法应用现代统计学的一些知识和技巧,结合传统的排序算法,对具有一般分布的数据进行排序,使排序的运算量为O(n),达到了排序运算量的下限,实验表明,在n较大时此算法效率要优于现有的同类排序算法。  相似文献   

5.
针对重复数据检测过程中增量数据重复值检测问题进行分析,在基本近邻排序算法基础上,提出增量近邻排序比较算法。该算法通过跳动窗口形式比较相邻数据,大大减少了数据比较次数;同时引入MapReduce模型对该算法加以改进以提高其海量数据处理的能力。实验表明,改进后的增量近邻排序比较算法在保证检则结果准确的前提下,能够有效提高增量数据重复检测的速度,并且算法具有较高的稳定性,更适应海量数据环境中重复数据检测任务。  相似文献   

6.
为改进直接选择排序算法的不稳定性及对数据的不敏感性,笔者研究了表选择排序算法.该算法约定用静态链表存储待排数据,先创建有序链表,再根据链接信息将数据顺序存储.此算法不仅保证排序算法的稳定性,也使时间复杂性由原来的O(n~2/2)在最好和平均情况下分别降到O(n)和O(n~2/4)(最坏情况不变),另外还保证后续其他操作也同样具备顺序存储的优点.从排序稳定性、数据比较次数和移动次数三方面来看,本文中提出的排序算法在简单排序算法中是最优的.  相似文献   

7.
本文给出一种有限次分组快速排序算法并证明该排序算法处理均匀分布数据记录,正态分布数据记录及一般概率分布数据记录的平均时间复杂性为O(N);给出四种快速 序算法分别关于均匀分布数据记录,正态分布数据记录,均匀波浪式分布数据记录和异常分布数据记录,进行排序的实验结果,表明有限次分组排序算法具有更快的效率。  相似文献   

8.
影响排序效率的因素有很多,首要因素是使用的算法;其次是为实现算法而进行的程序编制。算法时间复杂性的“0”表示法反映了渐近特性,但不能作为选择排序算法的唯一和最佳依据。本文指出了影响排序效率的各种因素,在实际中还需要根据这些因素选择不同的算法;文章还给出了几种排序程序的选择前提,分配排序的程序在执行时间上具有明显的优势。文章还给出了几种排序程序的实验数据,这些数据表明当待排序数据较多时,分配排序的程序在执行时间上具有明显的优势。  相似文献   

9.
鸡尾酒算法是一种基于双向遍历的排序算法,相比于传统的冒泡排序算法在排序效率上有一定的提高,但仍存在大量的重复数据比较以及对初始输入序列随机度过于敏感等问题.针对上述问题,引入了一种鸡尾酒排序算法的改进算法(Trigger-Conditional Cocktail Sort Algorithm,简称T-CCS).通过记录排序过程中每次发生数据交换的位置来缩小遍历区间,并以发生数据交换作为分段逆向遍历的启动条件,减少重复的数据比较.实验结果表明,T-CCS算法在不同规模输入数据的排序处理中均有较好表现,其排序效率相比于原算法提高了20%;同时,该算法受初始输入序列随机度的影响也相对低于传统的鸡尾酒排序算法.  相似文献   

10.
范哲铭 《当代地方科技》2012,(19):92-92,105
为了解决互联网时代大规模数据排序问题,本文提出了一种基于云计算的分组大规模排序算法,该算法利用了快速排序与归并排序的思想,对分发到各个云端的数据进行排序与整合;并能有效利用云端的计算资源以及存储资源,通过并行排序思想来缩短计算时间,提高排序效率。通过对该算法的时间复杂度评估和模拟测试,验证了该算法思想的有效性。  相似文献   

11.
为了让原本无序的数据有序,已经有了很多的排序方法.随着研究的发展,要排序的数据容量会与日俱增,人们一直努力研究排序的算法以提高执行的效率.端定位排序算法提出了一种从两端向中间的排序思想,能很大程度上提高排序的速度.理论和实验证明了端定位排序方法和现有排序算法相比的确能有效提高排序的效率,具有切实的可行性.  相似文献   

12.
当今时代,云计算与大数据越来越被人们所重视.算法的时间复杂度作为评估算法性能的最重要的因素之一,亟需得到改善和提高.而排序算法的优劣直接影响算法的运行速度.为了减少大数据和云计算算法的排序时间,提高排序算法运行的效率,对插入排序算法进行了优化.分别从随机获取无序区元素、分组、增量和设立标志位等方面进行优化,有效降低了插入排序算法的时间复杂度.实验结果表明,改进后的排序算法在排序效率上得到了很大提高.  相似文献   

13.
已有的社会化协同排序推荐算法的研究只是简单地融入用户的社交网络信息,没有考虑用户之间社会化信任网络的传递性;同时,该推荐算法的性能面临数据高度稀疏性问题的挑战.为了进一步解决这些问题,在传统的协同排序推荐算法(ListRank, List-wise Learning to Rank)和最新的社会化协同过滤算法(TrustMF, Social Collaborative Filtering by Trust)的基础上,提出了一种新的社会化协同排序推荐算法(TLRank),融合均高度稀疏的用户的显式评分数据和社会化信任网络数据,以进一步增强协同排序推荐算法的性能.实验结果表明:在各个评价指标下,TLRank算法的性能均优于几个经典的协同排序推荐算法,且复杂度低、运算时间与评分点个数线性相关;TLRank算法的推荐精度高、可扩展性好,适合处理大数据,可广泛运用于互联网信息推荐领域.  相似文献   

14.
为了解决大规模数据的存储与计算,近年来分布式系统得到了大量的应用.如何在分布式系统中对大规模数据集进行排序是影响许多应用性能的基础问题,其中不仅涉及每个节点上排序算法的选择,更重要的是设计协调各节点的分布式算法.本文总结了分布式系统中常用的分布式排序算法,对每种算法的执行流程、代价模型和适用场景进行了分析,并通过实验对分析结果进行了验证.本文的工作可以帮助开发人员选择和优化分布式环境下大规模数据排序的算法.  相似文献   

15.
利用二叉树的结构性质 ,给出了一个基于二叉树的位排序算法 (BBS算法 ) .并证明了 BBS算法是生成二叉树的这组数据按排序码升序的排序 ,最后 ,我们讨论了该算法的算法复杂性 .  相似文献   

16.
在决策支持系统中,排序查询是研究的热点问题。提出了一种在OLAP(数据仓库)数据立方体中对部分和查询结果进行排序的高效算法,该算法综合利用覆盖码和预排序,有效地解决了对部分和结果的top-k查询问题。实验结果表明无论数据在随机分布还是存在主导集情况下,该算法都能很好地改进查询的时间代价。  相似文献   

17.
以数值数据为排序对象,对交换排序、冒泡排序、选择排序、插入排序、归并排序以及快速排序等常用的六种排序算法的时间复杂度从实验统计角度进行分析和对比.本实验统计数据分析可知具有相同定性指标的排序算法,可能实际时间效率有着很大的差异,这组实验数据可为实际应用中排序算法的选择提供参考.  相似文献   

18.
堆排序算法具有低时间复杂度和低空间复杂度的优点;但对原始序列的有序性不敏感。快速排序算法是在平均情况下公认的高速算法;但有较高空间复杂度。对两个算法扬长避短,设计了一种新的排序算法HQSort;并从理论和实例两个角度分析了该算法的效率,在不同量级的数据集上对该算法和三种经典排序算法进行了对比运行和测试,验证了该算法不仅在时间效率上优于其他算法,而且在辅助存储空间上比快速排序算法减少约50%。  相似文献   

19.
付敬帅  李斌 《河南科学》2019,37(6):933-937
针对使用切片技术提取的点云截面数据点的多轮廓排序问题,提出了一种简便有效的算法.该算法分为两步,首先通过最近邻域搜索,根据距离阈值依次生成各个轮廓的闭合多边形,完成多轮廓截面数据点的粗排序和轮廓分离,然后将剩余数据点依照最小夹角原则插入到相应的轮廓闭合多边形中,达成截面数据点的精确排序.实验证明,该算法可对逆向工程中各种复杂的截面数据点实现精确排序和轮廓分离,将无序数据点转化为有序数据点,排序结果稳定、准确.  相似文献   

20.
反求工程中测量所得的三维数据一般是海量和无序的,为了提高重构的计算速度,减少存储空间,同时突出建模特征,在分析了常用数据精简方法的基础上提出了利用三角网格模型,以排序函数为依据简化数据的一种三角形折叠算法.该算法先以估算曲率的大小对欲精简数据进行划分,然后对各个区域的三角面构造可调加权排序函数.以排序函数为依据由小到大进行三角形折叠,算法以到相关三角平面距离最短的点作为新点来代替被折叠的三角面,以精简前后区域内的顶点法矢标准偏差和排序函数阀值对精简进行控制.试验表明,此算法排序函数构造简单,计算方便,对较光滑的模型数据处理是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号