首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
为了有效地发掘和利用异构系统在应用和体系结构上的并行性,以冷冻电镜三维重构为例展示如何利用应用程序潜在的并行性.通过分析重构计算所有的并行性,实现了将动态自适应的划分算法用于任务在异构系统上高效的分发.在曙光星云系统的部分节点系统(32节点)上评估并行化的程序性能.实验证明:多层次的并行化是CPU与GPU异构系统上开发并行性的有效模式;CPU-GPU混合程序在给定问题规模上相对单纯CPU程序获得2.4倍加速比.  相似文献   

2.
目的探究基于适应度的异构机器人系统模型与外部适应度的特点,提高系统性能与任务分配结果。方法应用数学模拟法分别研究机器人与任务,实证研究法验证外部适应度算法。结果对于机器人模型与任务模型,采用机器人原始性能参数建模;外部适应度采用正余切函数构成的算法,实现了任务最优分配。结论改进后的数学模型提高了系统的鲁棒性与可扩展性,改进外部适应度算法更为有效的反映机器人与任务间的匹配关系,为系统任务分配提供了可靠依据。  相似文献   

3.
由于GPU的高性能计算能力,越来越多地被用于集群系统中,但同时也给集群带来节点级的异构问题,使原来适用于同构集群的调度算法在异构集群中性能大大降低。为使异构节点间的负载均衡,降低总的作业执行时间,提出了一个面向GPU异构集群的自学习负载均衡调度算法。首先对Torque调度器进行扩展,使其支持GPU作业调度,然后将提出的自学习调度算法在Rocks操作系统及Torque调度器软件中实现。真实物理集群上的实验结果表明,扩展后的Torque调度器很好地支持GPU任务的调度,自学习调度算法较原来的Torque调度算法能达到更好的负载均衡。  相似文献   

4.
针对信息处理中常见的字符串匹配问题,通过对经典的Brute Force算法和KnuthMorris-Pratt算法进行分析,根据GPU异构并行计算任务的分配特性,设计一种针对Knuth-Morris-Pratt算法的数据重叠划分并行方案,并提出一种基于移动平台的异构并行字符串匹配算法KMP_MOP.在PowerVR移动平台环境下使用千万级长度的字符串数据对算法的性能进行测试,同时对算法在其他平台的执行情况进行比较,验证了并行算法的性能可移植性.实验结果表明,KMP_MOP算法能充分利用移动平台中的GPU性能,有效提高具有GPU的移动平台设备的字符串匹配效率.  相似文献   

5.
为实现持续有效的电信网络性能监控,提出一种改进的支持向量机预测基线法.利用人工免疫网络优化支持向量机参数、核函数参数、嵌入维数和样本规模等回归分析的自由参数,提出支持向量机免疫集成预测算法.根据电信网络性能的周期性特点构建同点时间序列模型,以预测的置信区间为基线对电信网络性能进行监控,通过对某软交换服务器的CPU负荷进行实验分析.研究结果表明:与经验自由参数相比,支持向量机免疫集成预测算法能取得更加精确的回归模式,其误差平方和减少55.4%,同点时间序列模型能有效克服连续时间序列中存在的异常输入敏感问题,准确发现多个连续的异常点.  相似文献   

6.
将自适应压力迭代法修正的Sola算法与相场模型相结合,建立过冷熔体在强迫流动状态下枝晶生长的Sola-相场模型.针对传统方法求解多场耦合相场模型时存在的计算量大,计算时间长,计算效率低等问题,提出基于CUDA+GPU软硬件体系结构的高性能计算方法.以高纯丁二腈(SCN)过冷熔体为例,在CPU+GPU异构平台上实现了存在流动时凝固微观组织演化过程的并行求解,并对基于CPU+GPU平台与CPU平台的计算结果及计算效率进行比较.结果表明,当计算规模达到百万量级时,与CPU平台上的串行算法相比,在CPU+GPU异构平台上达到了24.39倍的加速比,大大提高计算效率,并得到与串行计算相一致的结果.  相似文献   

7.
为满足战场环境下对兴趣区域进行覆盖探测的任务需求,提出了一种基于区域覆盖的多无人机协同探测任务分配策略。首先通过最小圆覆盖法确定无人机在兴趣区域中的目标航迹点,其次进行多机协同任务规划,在目标分配模型的基础上进一步建立时间分配模型,然后利用改进灰狼算法对任务分配模型进行求解,最终实现资源优化分配决策方案的获取。仿真结果表明,所提算法相比其他算法具有更快的收敛速度,能够更加有效地解决区域覆盖探测资源优化分配问题。  相似文献   

8.
提出一种基于图形处理器(GPU)的对称正定稀疏矩阵复线性方程组迭代算法. 首先, 采用基于GPU的共轭梯度法和双共轭梯度法, 实现GPU上的矩阵向量乘操作, 并充分优化相应的算法步骤; 其次, 实现基于GPU的对角元预处理、 不完全Cholesky分解和对称超松弛3种预处理方法, 提出一种基于GPU的求解三角方程组并行算法; 最后, 实验分析各种预处理方法的优劣. 实验结果表明, 该算法较CPU串行迭代算法与经典的直接法速度提升较大, 最高可达到76倍的加速比.  相似文献   

9.
在多诊断资源协同诊断领域,由于装备复杂性和诊断资源异构性,诊断任务分配应具有自适应性.提出了一种动静态集成的协同诊断任务分配方法.在静态任务分配中,以装备的定性模型和模糊关系矩阵建立了诊断任务关系模型,通过改进D算法实现诊断路径规划,运用多约束整数规划进行资源配置;在动态诊断任务分配方法中,引入了基于效用和协商的扩展合同网方法.最后,通过工程装备的诊断事例验证了分配方法的有效性,并通过结论总结和延伸了该方法.  相似文献   

10.
为改善信息安全风险评价的精确度,利用改进的粒子群算法,提出了一种新的优化回归型支持向量机的信息安全风险评估方法。首先,通过模糊理论对信息安全风险因素进行量化预处理;其次,经过预处理后的数据输入到回归型支持向量机模型中;再次,利用改进的粒子群算法来优化和训练回归型支持向量机的参数,得到了优化后的信息安全风险评估模型;最后,通过仿真实验对该模型的性能进行验证。实验结果表明,提出的方法能很好地量化评估信息系统风险,提高了信息安全风险评估的精确性,是一种有效的评估方法。  相似文献   

11.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

12.
彩虹表密码分析算法的图形处理器优化设计与实现   总被引:1,自引:0,他引:1  
设计了一种在图形处理器(GPU)上的彩虹表密钥分析算法.结合GPU单指令多线程的特点改进了Oechslin的彩虹表算法,将预处理中彩虹链的计算分别映射到GPU的单个线程,并利用预计算链提高了在线分析的效率.所使用的硬件平台GPU Tesla C1060 相对于CPU Core2 Duo 2.8 GHz,在运行速度方面,预处理提高了41.2倍(每秒110×106次DES加密),在线分析提高了3.52倍.在此系统上用1.3 GB的磁盘空间,平均2.73 s的在线分析时间以及46%的概率,成功获得了加密选择明文的40 bit DES密钥.  相似文献   

13.
面向CPU+GPU异构计算的SIFT   总被引:1,自引:0,他引:1  
依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给出合理的调度算法.结果表明,在GeForce GTX 285上实现的尺度不变特征变换(SIFT)并行算法相比CPU上的串行算法速度提升了近30倍.  相似文献   

14.
提出了一种在CNGrid网格服务环境下解决期权定价问题的并行应用方法.这种方法基于BSDE(backward stochastic differential equation)模型.根据异构计算资源的特点,使用CUDA和MPI分别在GPU计算节点和CPU计算节点上实现并行算法,比较不同编程在异构计算节点上的实现效率.通过监控计算节点上计算任务的负载状况,利用CNGrid所提供的计算服务,灵活地在异构计算节点上完成期权定价计算任务.  相似文献   

15.
对于大规模SAR回波数据,单纯依靠CPU实现实时成像处理存在较大挑战。近年来出现的GPU图像处理单元为SAR成像处理提供了一个理想的处理平台。本文结合GPU和CPU的特点,利用基于CPU-GPU的异构协同处理平台来加速SAR成像算法。同时,为了充分发挥该异质架构的性能,文中提出了一种改进的基于子孔径架构的成像算法,并在此架构上对超大规模SAR回波数据进行了成像处理,取得良好的成像效果和加速比。  相似文献   

16.
针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,将应用数据按比例划分为大小不同的数据块后分批提交给GPU处理,使系统的传输资源PCI-E总线和计算资源GPU在一段时间内并行工作,从而实现了应用通信与计算的重叠.在处理按照比例划分的数据块过程中,尽可能充分利用系统的传输资源和计算资源,以减少数据传输和计算的相互等待时间.实验结果表明,采用数据比例划分方法后的应用性能明显提高,可以有效地重叠通信与计算时间,矩阵相乘和快速傅里叶变换总执行时间比未划分时分别减少了5%和30%左右,比平均划分时分别减少了3%和6%左右.  相似文献   

17.
在异构边缘网络中,基站和边缘服务器的密集部署使系统功耗激增,为移动运营商带来了高额成本.同时,由于异构系统中任务的多样性和复杂性,高效的资源分配和任务迁移构成了严峻的挑战.针对上述问题,建立了服务器间的任务迁移和服务器睡眠模型,提出了一种面向异构边缘网络中服务器多睡眠模式的任务迁移算法.该算法先将问题按时隙划分为多个子...  相似文献   

18.
 高性能计算机是推动工业发展的重要工具和手段。本文综述高性能计算机发展的几个关键问题,阐明处理器的发展趋势正在过渡到新一代多核心异构并行计算系统过程中,其中多核心缓存设计和多核心异构编程模型设计是关键因素,云计算技术可能成为将来高性能计算的重要推动因素。最后,结合石油勘探中对计算机的需求,以CPU+GPU 的异构计算系统为例,阐明高性能计算的重要推动作用。并行算法的开发平台和程序设计方法是影响石油勘探中的高性能计算应用的主要瓶颈;磁盘I/O、高速网络和并行文件系统是制约高性能计算的重要因素。  相似文献   

19.
多Agent系统中任务分配问题的分析与建模   总被引:5,自引:0,他引:5  
针对多Agent系统(MAS)内外环境变化所产生的不确定性和任务分配序列决策的要求,利用马尔科夫决策过程(MDP)模型对MAS中的动态任务分配问题进行了分析和建模.其中,状态空间由各Agent的当前负载和待分配的任务组成,每一状态下有多种任务分配方案,利用迭代方法可以获得最佳的任务分配方案以实现系统长期收益最大化的目标.仿真实验表明,MDP模型可以合理地模拟MAS中任务分配的运作过程,并在小规模环境下方便地获取最优任务分配策略.  相似文献   

20.
关于CPU+GPU异构计算的研究与分析   总被引:2,自引:0,他引:2  
许桢 《科技信息》2010,(17):I0097-I0097,I0014
在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是随着通用计算程序接口(OpenCL)的发布,CPU+GPU的异构化计算这种看起来像是CPU和GPU混合体的出现,相信这将使计算机处理器又将迈上一个新台阶,这种异构化成就的是更加高性能,更加高性价比的处理器,而这必将掀起GPU和CPU革命的高潮。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号