首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 24 毫秒
1.
徐丹  郑彬彬 《科技信息》2011,(8):228-228
本文介绍了当前国际计算机科学界的前沿课题之一———遗传计算的基本思想。文章首先分析遗传算法内在的并行性,介绍并行遗传算法的四种模型:主从式模型、粗粒度模型、细粒度模型及混合模型,给出每种模型的特点及适用范围,指出各模型在应用中需解决的关键问题。最后介绍目前对并行遗传算法如何进行评价。  相似文献   

2.
石杰 《科技信息》2009,(33):I0068-I0068,I0145
介绍了并行遗传算法的思想及四种并行模型:主从式模型、粗粒度模型、细粒度模型及混合模型,讨论了并行遗传算法在关联规则挖掘中的应用。  相似文献   

3.
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.  相似文献   

4.
分析了并行遗传算法的主从并行模型、粗粒度并行模型和细粒度并行模型等3种并行模型;重点对粗粒度并行遗传算法的异步迁移策略和同步迁移策略进行了比较研究,以K-中心聚类作为实验背景,说明不同的迁移策略对K-中心聚类的效果有一定影响,并得出了异步迁移策略的性能和聚类效果优于同步迁移策略的性能和聚类效果。  相似文献   

5.
VLSI技术进步和应用驱动使多核技术成为主流的微处理器设计技术。多核处理器作为一种时空域器件,应把超级计算机作为多核处理器的设计参考系,其主流架构将最终收敛到"小核、大阵列、层次化"上。文章利用Xilinx Virtex5-330TFPGA器件,设计实现了一款集成16个处理核的具备层次化架构特征的嵌入式多核处理器原型芯片,工作频率为90 MHz。多核处理器利用层次化的体系架构、灵活的片上互连、多种同步机制以及合理的并行程序模型,成功加载了实时视频淡入淡出(fade-in-fade-out)混叠应用(320×240,30帧/s)。基于该多核处理器架构,研究比较了粗粒度和细粒度2种并行编程模型。细粒度模型的多核同步操作稍复杂,但很好地掩盖了应用的串行操作时间,对视频淡入淡出混叠应用的加速比可达6.97。  相似文献   

6.
对无网格数值模拟的并行算法进行了详细研究.包括使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,并行计算无网格形函数及其导数,边界条件的并行处理,使用并行预处理共轭梯度法求解方程组以及负载平衡等.最后给出了无网格数值模拟并行计算的实施流程和计算实例.计算结果表明,无网格数值模拟具有很高的并行性和很好的并行效率,计算规模越大,并行效率越高.  相似文献   

7.
基于CPU多核处理器实现了粗粒度2.5维电磁场并行正演算法, 使用OpenMP对串行算法的频率域进行粗粒度分解, 主线程进行任务分配, 从线程在CPU多核上并行计算各频率域电磁场值, 并分析了OpenMP并行效率与模型及核心数目的关系. 多组不同模型测试结果表明, 本文并行方法与串行方法得到的数值结果相同, 并获得了接近CPU逻辑核心数目的性能提升.  相似文献   

8.
叠前弹性波反演非线性优化方法   总被引:6,自引:5,他引:1  
针对传统遗传算法自身存在的早熟收敛、搜索空间小以及计算效率低的问题,在保证算法收敛和最大限度地搜索模型空间的基础上,对遗传算子采取相应策略进行了改进,并通过界约束以增加解的稳定性.为了提高计算效率,采用粗粒度并行遗传算法,将并行计算机的高速并行性和遗传算法固有的并行性相结合,进行多种群并行搜索.选择合适的迁移拓扑结构和迁移策略,构建了并行模型,并给出了改进后并行遗传算法的设计流程图及详细算法描述.采用该算法进行了叠前弹性波反演的实际计算,取得了良好的效果.  相似文献   

9.
提出了面向大型飞机设计的气动模拟软件CCFD的架构和实现方法.对于复杂流场建模和高分辨率湍流数值模拟,CCFD采用对比分析各种计算模型和提高计算网格分辨率的方法来得到高精度的模拟结果和更精细的流场模型.CCFD在并行编程模型、负载平衡、通信重叠等多个方面针对万核级的大规模并行计算进行了改进.同时,CCFD实现了批处理作业、双模式控制参数设置、计算过程监控等功能的用户友好操作界面.通过在"天河一号"上进行的测试可以看出,随着并行规模从128核增加到近万核(8 192核),作业的运行时间稳定降低,加速比稳定增加.  相似文献   

10.
基于Matlab平台,采用有限元方法实现了对二维拉普拉斯(Laplace)方程在GPU平台上的加速.通过对物理问题的分析与物理模型的构建,完成总体CSR格式存储的刚度矩阵的生成;使用Matlab和CUDA混合编程,在Matlab平台上实现该有限元问题的并行加速;并结合Cu Blas数值计算库采用PCG算法求解装配后的大型线性稀疏方程组,从而高效地迭代出各格点的速度势.该算法既充分发挥了Matlab在数值计算方面的高效性,又充分发挥了GPU在细粒度并行加速方面的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号