首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 65 毫秒
1.
DSP并行处理系统设计的几个关键问题   总被引:3,自引:0,他引:3  
在大量的实际运用基础上,从原理、理论、算法出发,探讨DSP并行处理系统在设计中经常遇到的几个关键问题:加速比、并行效率、处理单元的选择、网络结构之间的关系及对系统的影响,并通过实例进行说明。  相似文献   

2.
针对大规模并行处理,计算提出了基于LAN的并行系统的设计思想,着重分析了并行系统的并行效率,加速比和放大率等性能以及影响这些性能的处理机性能,并行度,通信效率主要因素,并讨论了偏斜,传输瓶颈,安全和对称等几个对该系统有重要影响的问题。  相似文献   

3.
加速比是衡量并行处理性能的重要指标之一;较高加速比的获得除与任务的划分、并行算法的选择等有关外,还与各节点间的通信有关;在大多数并行系统中,在数据规模确定的情况下,程序的加速比随节点数的增加而增加,但是大多数机群系统的节点间是共享物理传输介质的,这就使得许多并行程序的加速比在节点数目超过某一个值之后会随着节点数的增加而减少;文章通过数值实验研究,分析了节点间通信对加速比的影响,进一步论证了节点间通信对加速比的重要影响。  相似文献   

4.
为了快速求解线板型静电除尘器电场分布问题,采用OpenFOAM开源有限容积库及g++自定义静电除尘器电场分布求解器并行模拟计算。结果表明:串行计算与并行程序的计算结果完全吻合。在并行计算过程中,在处理器数量为2颗和4颗时会出现超线程加速比现象。随着并行处理器数量增加,并行加速比呈非线性增加,并行加速比先增加后减少。对于相同的收敛准则,高网格数量情况下的并行加速比小,并行效率低。  相似文献   

5.
用并行处理系统的目的是为了获得高性能,有关性能问题和并行软件技术的内涵是丰富的:不同的目标相互制约,其中处理系统中通信对并行计算性能有一定的影响,可以通过加速比来测量,通过时间局部性和空间局部性来解决这种影响。  相似文献   

6.
从程序粒度的概念出发,介绍粒度的表示,以及程序的粒度图。在此基础上,进一步探讨粒度的组合与程序的并行调度。  相似文献   

7.
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制.而使用并行算法是解决上述限制的最有效途径.为此,在集群计算环境下,使用SPMD计算模型和基于MPI消息传递技术设计实现了矩阵相乘的并行算法.实验表明,此并行算法在一定矩阵规模下具有较好的加速比和并行效率.  相似文献   

8.
为了快速求解10000个粒子的湍流碰撞聚合问题,采用OpenMP对Smoluchowski方程的FORTRAN求解程序进行了并行处理.数值结果表明:在不改变串行程序结构的情况下,仅对循环体部分进行并行处理,并行效率可高达80%,且串行程序与并行程序的计算结果完全吻合.对于大计算量循环体的并行计算,采用全部处理器进行并行计算时耗时最小.但是对于小计算量循环体的并行计算,采用全部处理器进行并行计算时耗时不一定最小.  相似文献   

9.
用并行处理系统的目的是为了获得高性能,有关性能问题和并行软件技术的内涵是丰富的:不同的目标相互制约.其中处理系统中通信对并行计算性能有一定的影响.可以通过加速比来测量,通过时间局部性和空间局部性来解决这种影响。  相似文献   

10.
利用区域分解方法,对模拟大气重力波在中高层大气中非线性传播过程的数值模式进行了并行化处理,从而建立了并行数值模式.在两个并行机群上对并行数值模式的测试结果表明:在千兆以太网和内存配置较低的机群系统上,并行效率随着进程个数的增加而减低,当进程个数增加到16时,并行效率仅为0.65.在内存配置较高的机群系统上,并行效率随着进程个数的增加并不减小,甚至出现了超线性加速现象.比如当进程个数为160个时,并行效率达到1.28.通过比较研究可以说明,机群系统的缓存、物理内存和网络通讯延时都是影响加速比的重要因素.尽可能大的缓存和物理内存能够有效提高加速比,网络交换机的选择需要在延时和带宽间进行权衡.  相似文献   

11.
设计并实现了具有多个OLAP服务器并行处理的多维数据分析系统。此系统占用较少的存储空间、具有较短的处理时间和较快查询速度。解决了传统系统中请求叶子数据聚合的查询速度慢的问题,同时还满足了系统的可靠性、不间断运行数据更新以及扩展性的要求。给出了系统的结构与原理、实现方法以及测试的结果。  相似文献   

12.
为取得“超计划功能”,PC电脑群已成为一种很受欢迎的方法,这种方法能够处理诸如在过去几年里学术领域和娱乐领域的劳动密集型工作。而分布式的体系结构和可测量性的个人电脑为并行计算过程中易分散的大量固定数据提供了十分合适的硬件基础。然而,这一过程需要先进的编程技巧,大量的调试时间以及数据处理和计算规则并行的困难性(实时共享虚拟现实产生的典型)是灵活运用导向群的主要障碍。设计一个新的拓扑群,这一拓扑群Java 3D数据结构以产生大量虚拟现实数据结构。但是专家们对实验研究中给予特别重视的关于虚拟现实作品的设计方法产生了争议。在相对产缓的识别图表曲线的过程中,值得关注的是执行程序的运行时间以及软件类的组成部分的可利用性。这有助于建立一个广范围的实时的虚拟现实环境,以促进设计方案的提出,从而能越过设计领域,扩大虚拟现实的应用范围。  相似文献   

13.
研究了一种采用FPGA +双DSP的航片高速并行处理系统 ,并用区域分解算法对航片处理任务进行划分与分配 .FPGA实现对航片预处理 .DSP实现航片高层处理 .DSP部分由双TMS32 0C6 2 0 1芯片构成高速运算处理单元 ,峰值处理能力每s可达 3.2× 10 9条指令 .FPGA和DSP具有各自的存储器 .在系统中应用符合数字图像处理特点的区域分解并行算法 ,这样使在空间域串行图像处理算法得到并行化 ,从而合理地对任务进行划分与分配 ,同时保证各DSP处理机负载平衡 .该方法适合多种图像处理算法 ,实现简单 ,大大减少了开发的工作量 .经试验表明 ,该实时航片处理系统具有高效、简单、可靠的特点 .  相似文献   

14.
15.
p-HPF是一个基于cluster体系结构的HPF并行编译系统 ,它不仅支持数据并行计算范例 ,而且也支持任务并行范例。给出了 p-HPF并行编译系统的体系结构和实现策略 ,介绍了 p-HPF实现数据并行和任务并行的机制 ,包括数据分布方法、外部过程调用等。还给出用 p-HPF求解N-body、快速傅立叶变换、单炮地震资料的处理等应用实例。  相似文献   

16.
一种多片DSP在并行处理中的数据通信方法   总被引:1,自引:0,他引:1  
HPI接口是为了解决多DSP之间数据共享而设计的,详细地介绍了HPI接口的外部硬件接口信号及控制寄存器,并给出了一个双DSP的接口电路及控制程序,方便快捷地实现了数据读写功能,由于HPI接口的简单、快速、不占用系统工作时间的特点,为多DSP的并行信号处理提供了一个硬件环境。  相似文献   

17.
用DSP搭建一个图像采集处理系统   总被引:4,自引:0,他引:4  
本文介绍了用TMS320UC5409为核心搭建图像采集处理系统,同时对采集来的图像预处理和压缩进行了研究.  相似文献   

18.
Batcher排序网络在排序深度上不是最优的,但由于有较好的并行性和时间复杂度,因此许多并行排序算法都基于Batcher排序网络.通过观察Batcher奇偶排序网络,提出在SIMD SM模型上的一种奇偶排序算法.该算法占用n/2个处理器,在○(log22n)时间里排序n个关键字.  相似文献   

19.
共焦测量方法由于其高精度、高分辨率及易于实现三维成像数字化的独特优势而被广泛应用。文章针对并行共焦探测系统,介绍了共焦系统图像数据处理与三维信息获取算法,提出利用插值方法来获取三维数据,提高系统测量速度和精度。编制了并行共焦探测的数据图像采集与处理专用软件,采用了基于Windows界面的模块化结构设计,具有图像采集、纵向步进控制和数据处理与三维重构等多个功能模块。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号