首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
为缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,假设每个任务排它地使用一组处理机.  相似文献   

2.
为取得网格中流水式计算的高吞吐率,提出一种任务指派算法X max min.在一个流水线中,任务彼此是并行的,且每个任务本身是可并行化的.当多个任务被指派到同一个并行系统时,通过最小化任务计算成本的最大值确定每个任务分得处理机的个数.任务用于收发数据集的通信成本依赖其他任务的指派,故当相关任务的指派未完成时,需要在任务通信成本中引入均值估计.任务响应时间是计算成本和通信成本之和,它是任务指派的函数.用max min算法确定任务指派,可有效降低任务响应时间的最大值,从而使流水线的吞吐率得到提高.仿真实验表明,X max min算法使流水线取得的吞吐率与复杂的Taura算法相当.  相似文献   

3.
根据实时信号处理应用中嵌入式计算硬件的资源受限特点,提出一种新的适合计算任务流的实时任务调度算法,以满足吞吐率为调度约束条件、以最小化流水线时延为调度目标并兼顾资源节约原则.算法为两层结构,首先采用任务插入策略得到满足吞吐率约束的中间结果;再通过基于任务复制的优化调度,分析了影响调度长度的关键任务并按照所定义的优先级构造关键边的决策树以确定需复制的关键父任务,充分利用了处理器的空闲时间片以减少时延.另外还设计了检测任务复制后出现的冗余处理器的方法.通过随机任务图仿真分析,说明该算法能以较小的处理器使用量获得满足吞吐率约束的调度结果.  相似文献   

4.
并行流水线LMS算法及其性能分析   总被引:1,自引:0,他引:1  
尚勇  吴顺君  项海格 《自然科学进展》2001,11(10):1032-1037
通过将并行处理方法引入流水线LMS(PIPLMS)算法的设计,提出一种新的并行PIPLMS算法.与常规PIPLMS算法相比,提出的算法具有更小的流水时延,更高的数据吞吐率,更快的收敛速度和更大的保证算法收敛的步长因子μ选择范围,同时对具有相关性的输入具有一定的去相关作用,特别适用于滤波器阶数高,要求系统收敛速度快的应用场合.也便于系统硬件设计.  相似文献   

5.
消除瓶颈问题提高流水线效率方法的讨论   总被引:1,自引:0,他引:1  
针对流水线处理机对吞吐率、加速比和效率,通过实例及有关方法的证明,从理论上给出流水线处理机提高效率的改进方法并纠正某些文献中的一些误区,对流水和重叠技术在理论中得到提高。  相似文献   

6.
提出了一种基于并行的碰撞检测算法,主要采用并行算法中的分治策略,建立环境中每个物体的平衡包围盒树,通过遍历每两棵包围盒树,形成对一任务树的遍历,并将所有任务树的遍历平均分配到每个处理器,然后采用并行算法中的流水线技术,通过划分进程来遍历任务树,从而加速碰撞检测算法,同时在进程中也应用了多线程技术,因而能运行于单处理机和多处理机上。  相似文献   

7.
任务调度是网格计算研究的核心问题之一,任务调度策略的好坏将直接影响网格系统的性能.在对已有启发式任务调度算法进行分析比较基础上,针对于网格计算中的高吞吐率应用的任务调度问题,提出了一种综合考虑资源节点性能度量和任务优先级的负载均衡的启发式任务调度算法.进行了仿真实验,在任务完成时间和系统吞吐率二个方面与传统的Min-min算法、Max-min算法和Sufferage算法进行比较.仿真结果表明该算法不但可以减小任务总的完成时间,而且可以提高系统的吞吐率,更适用于高吞吐率应用任务调度问题的解决.  相似文献   

8.
FFT算法作为OFDM系统的核心算子占用其系统处理的大多数时间,为提高OFDM系统数据传输速度,提出了一种改进的多路并行流水线型基22FFT实现架构。在实现过程中着重对旋转因子的存储进行片上缓存优化,减少了乘法运算次数从而减小整体运算复杂度;设计的数据整合模块用于控制时序,从而保证P路并行流水型架构正确实现,数据运算吞吐率成P倍提高。RTL仿真结果表明,与同类架构相比,提出的架构在硬件开销适中的同时使得性能分别提升了127%、204%、5088%,并且具有FFT点数可扩展的特点,可满足随着通信标准的不断提高,FFT点数逐渐增大的实际应用需求。  相似文献   

9.
一个多功能流水冲突优化调度算法   总被引:1,自引:0,他引:1  
在对多功能流水冲突问题进行分析的基础上,给出了用时段间隔矩阵表示流水线冲突状态的方法,分别计算出每种调度法的平均间隔时段数,找出其中的最小者,实现了流水线各后继任务流入流水线所用间隔的最佳调度.此调度策略,使流水线的吞吐率达到最高,且方法简便明确,易于计算机实现.文章同时给出了实现多功能流水线冲突的优化调度算法.  相似文献   

10.
根据流水线技术,将光纤通道适配器的数据传输阶段与SCSI适配器的I/O任务执行阶段按流水线技术并行执行,能充分减少系统总的处理时间,提高系统总的数据传输速度.以FC—RAID3000为例,分析了磁盘阵列中I/O流水线技术的适用性与基本原理,介绍了通过设置多进程来并行处理光纤卡和SCSI适配器的数据传输过程,对实现流水线前后的性能进行了测试和比较.经测试发现,阵列系统最大数据传输率与未采用流水线技术的系统相比提高了1倍.  相似文献   

11.
针对大数据在线聚集执行时间长、执行性能及延迟调度性能较差的问题,提出基于MapReduce的大数据在线聚集优化程序设计.使用分片聚集方法使集群中所有机器的计算资源得到充分调用,采用子连接的启发式优先方法优化各节点本地执行连接任务关系运算,实现大数据在线聚集的并行连接.利用混合近似查询框架的大数据在线聚集动态切换机制及基于渐进近似估计的动态切换机制,降低混合近似查询切换误判率,增强大数据在线聚集的执行性能.实验结果表明,该方法设计的在线聚集优化程序在不同数据规模下的执行时间较小,同时在基本频繁查询性能方面具备显著优势.  相似文献   

12.
基于FPGA的流水线珠算加法器设计   总被引:1,自引:1,他引:0  
在图像处理、数字信号处理等领域需要用到大量加法运算,加法器运算性能对整个系统影响重大。根据操作模型原理,采用珠算算法设计了一个流水结构的并行高速硬件加法器,并在Xilinx Virtex-II的FPGA上实现了设计方案。在FPGA上集成8个处理单元完成并行计算,处理单元运用流水线结构,提高运算频率,并采用数据调度模块解决流水线上“数据相关”问题。仿真结果表明,32位珠算加法器平均运算仅需0.712ns,其速度是32位串行加法器的8.771倍,是32位并行加法器的1.588倍。这对于进一步优化实现硬件乘法器,甚至最终实现硬件除法器提供了研究空间。  相似文献   

13.
基于管道爆炸数值模拟的架空天然气管道并行间距研究   总被引:1,自引:0,他引:1  
从天然气管道失效泄漏引发爆炸现象出发,通过理论分析建立架空管道泄露模型,应用Matlab计算出管道泄露总量中参与爆炸的体积,通过TNT当量法将体积值转化为管道爆炸模型的初始当量。利用Autodyn软件建立管道爆炸物理模型,计算不同并行间距下管道受并行管线爆炸冲击超压及变形量。依据管道椭圆应变准则评定不同并行间距下管道受冲击变形风险。结果表明:架空管线受并行天然气管线爆炸冲击产生的变形破坏为超压破坏和冲量破坏两种形式。架空管道大变形位置为正对爆炸源最近点和背对爆炸源最远点。架空天然气管道安全并行间距:一级和二级风险距离分别为0~2和2~5 m,三级风险距离为5 m以上。将数值模拟结果与理论计算结果对比,验证了该数值计算方法的可行性。  相似文献   

14.
卷积神经网络(CNN)已被广泛用于图像处理领域,且通常在CPU和GPU平台上进行计算,然而在CNN推理阶段存在CPU计算速度慢和GPU功耗高的问题。鉴于现场可编程门阵列(field programmable gate array,FPGA)能够实现计算速度和功耗的平衡,针对当前在卷积结构设计、流水线设计、存储优化方面存在的问题,设计了基于FPGA的卷积神经网络并行加速结构。首先将图像数据和权值数据定点化为16 bit定点数,一定程度上减少了乘加运算的复杂性;然后根据卷积计算的并行特性,设计了一种高并行流水线卷积运算电路,提高了卷积运算性能,同时也对与片外存储进行数据交互的流水线存储结构进行了优化,以减少数据传输的时间消耗。实验结果表明,整体加速器在ImageNet数据集上的识别率达到94.6%,与近年来相关领域的报道结果相比,本文在计算性能方面有一定的优势。  相似文献   

15.
基于遗传算法的油气集输管网运行效率优化   总被引:1,自引:0,他引:1  
油气集输系统的能量耗散,在油田生产能量消耗中占主导地位.若集输管网各项运行参数没有随着油井开发参数的变化而相应调整,将导致集输系统能耗逐年增加,集输用气和用电单耗不断升高.对于这一问题,以树状双管掺水集输管网为研究对象,在布局一定的情况下,以管网掺水量、掺水温度、掺水压力为参数变量,运用遗传算法编制程序对其优化.以某油区树状双管掺水集输管网为例,通过运算得到优化后的运行参数,管网运行能耗比优化前降低了28%.  相似文献   

16.
LDPC码是一种纠错能力极强的编码,已广泛用于新一代数字电视,深空探测,卫星通讯等多种领域,基于不同要求出现了许多不同的编码标准,所以定制化的LDPC码译码算法的硬件实现已成为当今的研究热点之一。为满足卫星通信中高速数据传输的需求,使用LDPC码Normalized最小和译码硬件实现算法以及归并算法原理,并结合FPGA适合并行计算的特点,提出一种基于流水线的部分并行LDPC译码的FPGA设计,通过仿真和实验,最终完成满足卫星高速通信需求的LDPC译码器设计。最终使用Altera公司FPGA上完成译码器设计,整个系统在时钟频率为150 MHz的条件下,数据处理速率达到1.5Gb/s以上,数据吞吐率达到750 Mb/s纠错性能优异,完全满足卫星高速数据处理要求。  相似文献   

17.
分布式控制平面的并行路由计算性能是制约可扩展路由器大规模扩展的关键因素。根据反压理论建立了分布式控制平面并行路由计算模型,利用控制单元的队列长度信息判断每个控制单元的负载大小,自适应地调整控制单元间的负载分配,实现负载均衡。利用排队理论,根据损失率、系统利用率和服务等待时间这3个特征量对该模型进行了性能分析。用真实网络数据模拟验证理论分析的正确性。实验结果表明:与现有并行路由算法相比,该模型采用的反压任务分配算法能够根据控制单元的负载大小和控制单元数量自适应地均衡分配负载,有效地提高了可扩展路由器的并行路由计算性能和可扩展性。  相似文献   

18.
苏嵯输油管道是呼伦贝尔油田第一条长距离输油管道,承担着其主要的原油输送任务。为了降低原油输送成本,以生产运行费用最小为目标建立了苏嵯输油管道生产运行方案优化数学模型。该模型属于混合变量非线性优化问题。根据模型的结构特点,采用两级递阶优化方法进行求解。优化结果表明,优化方案与现有运行方案相比,综合费用冬季可节省18%,夏季可节省28%。  相似文献   

19.
庆哈输油管道生产运行方案优化   总被引:2,自引:2,他引:0  
庆哈输油管道承担着大庆油田到哈尔滨炼油厂的原油输送任务。为了降低原油输送成本,以生产运行费用最小为目标建立了庆哈输油管道生产运行方案优化数学模型。该模型属于混合变量非线性优化问题。根据模型的结构特点,采用两级递阶优化方法进行求解。优化结果表明,冬季和夏季能耗分别降低了18%和23%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号