首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对最短路径算法处理大规模数据集低效的问题,提出了基于图形处理器(Graphics Processing Unit,GPU)加速的全源对最短路径并行算法.首先通过优化矩阵乘法算法实现了在工作组内和组间进行并行运算数据,然后减少了非规则行造成的工作项分支,最后降低了工作项对邻接矩阵计算条带存储资源的访问延时.实验结果表明,与基于AMD Ryzen5 1600X CPU的串行算法、基于开放多处理(Open Multi-Processing, OpenMP)并行算法和基于统一计算设备架构(Compute Unified Device Architecture, CUDA)并行算法相比,最短路径并行算法在开放式计算语言(Open Computing Language, OpenCL)架构下NVIDIA GeForce GTX 1 070计算平台上分别获得了196.35、36.76和2.25倍的加速比,验证了提出的并行优化方法的有效性和性能可移植性.  相似文献   

2.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到"CPU+GPU"异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

3.
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求.  相似文献   

4.
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.  相似文献   

5.
基于计算核和图形接口能够支持GPU 通用计算的特点,给出了一个规范的四层编程模型.本文主要研究了在系统抽象层中对计算核和图形接口层的图形操作抽象成通用计算的过程,其目的是屏蔽图形操作的痕迹,使在应用层执行屏蔽图形绘制程序,图形接口能够被抽象成GPU进行通用计算操作,提高面向GPGPU绘制语言的可描述性和规范化,并通过检测模块的设置检测运行环境,以提高效率.  相似文献   

6.
并行算法是当前研究解决算法效率问题的成熟技术之一。为提高GEP算法解决复杂函数优化问题的效率,将并行算法引入多细胞基因表达式编程函数优化问题,解决传统计算形式不能充分发挥多核处理器性能的问题。通过分析多细胞基因表达式编程并行算法的机理和MPI和Open MP混合并行模型,设计与实现多细胞基因表达式编程函数优化的并行算法(Parallel Multicellular Gene Expression Programming algorithm for Function Optimization)PGMFO。实验结果表明针对复杂的函数优化问题,在不影响精度和收敛性的情况下,PGMFO算法比原有的算法效率高出10%~20%。  相似文献   

7.
分段函数作为高等数学学习与研究中的重点及难点,其求定积分的相关计算也具有一定的难度。本文从分段函数、定积分及分段函数定积分的定义出发,根据分段函数的主要类型,并结合实例就其求定积分的计算方法进行了相应的分析和介绍。  相似文献   

8.
研究了与L-前缀关系无关的语言,把码的完全化构造方法推广为一般L-无关语言的完全化构造方法,并反过来用这种一般构造方法审视码的完全化.由于在码的完全化过程中,所涉及的关系与完全化之后的结果相关,从而必须引入各种技巧,运用L-无关语言完全化的一般构造方法可以阐明这种技巧的切入点,从而对码的各种完全化方法有一个较清晰的认识.  相似文献   

9.
图像分形编码压缩率大且质量较高,但实时性不好,因此难以推广应用.提出使用GPU对编码进行加速的方案.以图像FW算法为基础,在CUDA规范下,使用GPU并行地对图像中所有的待编码子树同时进行最优父树搜索.实验表明,该文编码方案在保持原有算法图像解码质量的情况下,可将编码时间缩短至毫秒级,满足了实时性的要求.  相似文献   

10.
利用新的图形处理器架构重新评估利用可编程图形处理器加速标准粒子群优化算法的可行性和有效性. 针对新的图形处理器架构进行系统分析, 在此架构下实现了标准粒子群优化算法的并行版本. 实验结果表明, 通过合理运用新的图形处理器架构, 与其他标准粒子群优化算法的并行版本相比, 取得了良好的加速比.  相似文献   

11.
报文分类已成为保障网络应用的服务质量及安全性的重要手段,而二维的前缀报文分类则是其中最为常用的.通过对规则冲突的分析,提出了一个基于三态内容可寻址存储器(TCAM)的二维前缀报文分类算法,该算法借助TCAM的并行查找能力,在一个指令周期内找到前缀的最长匹配,采用内存映像及相关数据结构消除了规则之间的冲突,实现了快速的二维前缀分类查找.与其他二维分类算法相比,该算法具有最小的查找时间复杂度和较小的内存空间复杂度.  相似文献   

12.
Spectrum sensing is the key and premise of cognitive radio ( CR). Current parallel cooperative spectrum sensing strategies have some problems, such as large number of cooperative secondary users and lack of consideration for the sensing overhead and the transmission gain. To solve those problems, an optimized parallel cooperative spectrum sensing strategy based on iterative Kuhn- Munkres (KM) algorithm was proposed. To maximize the total system profit, it considers the tradeoff between the sensing overhead and the transmission gain. Iterative KM algorithm was applied to obtaining the optimal assignment, which indicated when and which channels secondary users should sense. Furthermore, the required detection-probability was introduced to avoid unnecessary waste when the accuracy met the system requirement. Monte Carlo simulations show that the proposed strategy can obtain higher total system profit with fewer cooperative secondary users.  相似文献   

13.
为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略。在采用LL(1)方法实现自顶向下语法分析的并行编译中,LL(1)分析表的生成一直处于关键地位,由于文法中的终结符和非终结符个数很多,分析表的构造成为提高语法分析速度的瓶颈问题,因此考虑采用LL(1)分析表的并行生成。算法采用多线程的工作模式,并借助于线程间的通讯机制实现,此并行处理方法对编译的并行处理和提高效率有理论和现实意义。  相似文献   

14.
基因块编码的并行遗传算法及其在TSP中的应用   总被引:4,自引:0,他引:4  
针对简单遗传算法在较大规模组合优化问题上搜索效率不高的现象,提出了一种用基因块编码的并行遗传算法(Building-block Coded Parallel GA,BCPGA).该方法以粗粒度并行遗传算法为基本框架,在染色体群体中识别出可能的基因块,然后用基因块作为新的基因单位对染色体重新编码,产生长度较短的染色体,再用重新编码的染色体群体作为下一轮以相同方式演化的初始群体.将BCPGA应用于一个100城市的旅行商问题(TSP)中,结果表明本方法可以提高遗传算法的搜索效率,并且在相同条件下,BCPGA明显优于单纯的粗粒度并行遗传算法.  相似文献   

15.
将n个工件分配到m台平行机上加工,在工件的加工不中断及目标函数是极小化最大完工时间的条件下,对其GKK算法的最坏情形性能比界作了改进,并用实例表明了所得新上界的可达性。  相似文献   

16.
对电力系统的负荷恢复问题进行了研究.将该问题建模为一个多约束条件的组合优化问题,根据遗传算法特别适合求解大规模组合优化问题的特点,设计了一种粗粒度并行遗传算法来对此优化问题进行求解.在消息传递类并行软件开发环境提供的基于消息传递的并行虚拟环境下,采用master/slave的并行编程模式,有效地提高了算法的计算速度.将各种约束条件与目标函数融合在一起,建立一种序关系,来处理负荷恢复中的约束条件.求解过程满足系统的约束条件,不会出现系统的越限.算例结果表明,所提出的并行遗传算法不仅可以最大限度地恢复负荷,而且可有效提高算法的计算速度.  相似文献   

17.
分数间隔采样的并行均衡新算法   总被引:2,自引:0,他引:2  
由于模拟接收机在宽带条件下的性能不稳定等缺点,全数字接收机逐渐引起了人们的兴趣.针对一种全数字并行接收机结构(APRX), 提出了一种分数间隔的并行均衡新算法(PFSE). 该算法基于恒模算法(CMA), 充分利用了APRX中的数据重叠特点,实现了与上述APRX结构的完美结合.此外,还分析了由于该并行均衡器的引入,对APRX环路稳定性、环路噪声带宽等性能所产生的影响.仿真结果表明 该并行分数间隔均衡器的性能相对于波特间隔采样的均衡器具有明显的优势,而且相对于串行分数间隔均衡器,就消除串扰能力而言,该并行算法基本上没有带来损失.  相似文献   

18.
宽带码分多址系统中的并行干扰抑制技术   总被引:2,自引:0,他引:2  
研究了宽带码分多址系统中两级并行干扰对消算法(PIC)的性能,并通过基于MATLAB和COSSAP软件平台的系统仿真验证了结论的正确性。研究和仿真结果都表明,PIC算法在大多数情况下对系统的误码性能都有较大程度的改进,在现有技术条件下基本能够保证系统误码性能的稳定性,是一类具有实际应用价值的算法。  相似文献   

19.
考虑线性约束三块变量的凸优化问题,在部分平行分裂算法中选取不同步长参数的基础上,提出一种邻近部分平行分裂算法,并证明该算法的收敛性.该算法通过在部分平行分裂算法中选取不同步长参数的基础上,在一个子问题的目标函数中加入邻近项,建立新的参数条件.与部分平行分裂算法相比,该算法极大放松了参数条件,使算法更具实用性.数值实验结果表明,与已有算法相比,该算法的迭代次数和计算时间均显著下降.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号