首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
软件流水是开发指令级并行性的重要方法之一.IA-64是支持软件流水的EPIC(显式并行指令计算)体系结构.通过对NAS Benchmarks和MediaBench中软件流水所需的寄存器进行分析,指出静态通用寄存器是导致软件流水失败的主要因素.提出了解决IA-64中软件流水失败的两种方法限制循环展开因子的启发式算法(RSU)和堆栈寄存器分配算法(SRA).RSU通过适当减小循环展开因子,增加了软件流水的成功率;SRA在静态寄存器和旋转寄存器之间达到了动态的平衡,提高了寄存器的利用率,更有效地提高了编译器的性能.  相似文献   

2.
共享数据寄存器堆设计是超长指令字DSP处理器实现的难点.它的访问延时成为处理器的关键延时之一.在一高性能超长指令字DSP处理器的设计中,通过对传统单周期读写寄存器堆的设计方案进行深入的分析和研究,优化关键路径,设计出双周期读写结构的寄存器堆.通过电路实现比较后证实,双周期方案在减少27%访问时间的同时减少23%的面积.  相似文献   

3.
无线传感器网络是物联网信息采集的基础载体。数据融合技术在节省无线传感器网络资源的同时会引起较大的延时。在实时应用场景下,研究最小延时数据融合调度问题就非常关键。首先给出了最小延时数据融合调度问题的形式化描述,依据多叶节点融合树有利于增加同时传输的节点数量的思想,提出了一种基于多叶节点生成树的低延时数据融合调度算法(LDAS),该算法包括多叶节点数据融合树的构建阶段和融合调度阶段。最后通过仿真和对比证明了方案的有效性。  相似文献   

4.
提出了在寄存器分配时考虑可测性的一个新算法。它采用前向 /后向算法 ,将一个已调度好的 CDFG (ControlData Flow Graph)中的变量分配到相应的寄存器。通过对变量生命时间定义的扩展 ,本算法可以对带反馈的电路进行处理。在定义变量之间的寄存器复用相关函数时同时考虑了 3个准则 ,达到提高设计可测性的目的。实验结果表明了算法的有效性  相似文献   

5.
为了减少组播树共享算法(TS-MCAST)产生冗余包,有效地利用链路网络带宽,提出了一种基于光突发交 换(OBS)网络的最少冗余包的组播树共享算法(LRP-MCAST-TS)该算法实现过程中,引入了树分割规则,将满 足分割条件的组播树分割成森林,然后根据重叠大小将汇聚的组播会话划分成多个组播共享类$通过理论分析, 证明了(LRP-MCAST-TS)算法设计的正确性,达到了减少冗余包的目的。  相似文献   

6.
为了减少组播树共享算法(TS-MCAST)产生冗余包,有效地利用链路网络带宽,提出了一种基于光突发交换(OBS)网络的最少冗余包的组播树共享算法(LRP-MCAST-TS)。该算法实现过程中,引入了树分割规则,将满足分割条件的组播树分割成森林,然后根据重叠大小将汇聚的组播会话划分成多个组播共享类。通过理论分析,证明了LRP-MCAST-TS算法设计的正确性,达到了减少冗余包的目的。  相似文献   

7.
为了自动综合设计迭代产生的行为时序,提高综合前后设计时序的一致性,对VHDL同步延时语句的高级综合方法进行研究.将延时转化为适当约束,提出相应调度模型及调度算法,采用启发式方法使解空间搜索算法跳出局部最优,该算法可以在多项式时间复杂度下得到近似最优解.实验结果表明,该算法能有效综合同步延时语句,使综合前后设计时序达到较好一致,提供了一种便于给出延时约束的手段,减少了综合过程的人工干预,提高了设计效率.  相似文献   

8.
针对基本快速扩展随机树(RRT)算法在路径规划中具有树的扩展随机性大、冗余节点多、容易在目标点周围发生振荡、规划的路径较长等问题,提出了一种改进的RRT算法。该算法首先采用目标偏向策略,通过引入动态权重系数使树尽可能地在向目标点进行扩展的同时又能够即时地避开障碍物;利用自适应扩展步长减少树在目标点附近的振荡;最后,对路径进行剪枝处理,并用三次B样条曲线对剪枝后的路径进行平滑处理。仿真分析的结果表明,与基本RRT算法相比,改进的RRT算法有效减少了冗余节点数,规划的路径更短,减少了19.56%,同时规划时间大大降低,减少了54.08%,有效地提高了路径规划的效率。  相似文献   

9.
RISC体系作为精简指令集计算机的兴起,使得多发射处理器的指令调度算法成为研究热点。本文从程序块划分和执行角度,讨论了多发射处理器的指令调度算法,介绍了几种局部指令和全局指令调度的影响力较大的算法。它们通过指令调度的优化,提高多发射处理器内部功能部件的执行并行性。本文还给出了进一步研究方向,构造多发射结构多处理器并行处理系统,实现处理器之间的并行技术和处理器内部的并行技术的整合。  相似文献   

10.
RISC体系作为精简指令集计算机的兴起,使得多发射处理器的指令调度算法成为研究热点.本文从程序块划分和执行角度,讨论了多发射处理器的指令调度算法,介绍了几种局部指令和全局指令调度的影响力较大的算法.它们通过指令调度的优化,提高多发射处理器内部功能部件的执行并行性.本文还给出了进一步研究方向,构造多发射结构多处理器并行处理系统,实现处理器之间的并行技术和处理器内部的并行技术的整合.  相似文献   

11.
提出了适于异构环境独立任务调度的可调节动态调度算法(AS算法)。该算法以任务与处理机的执行时间和完成时间作为参数共同构造任务调度顺序的衡量值,其中二者所占的比重能进行适当调整。AS算法克服了Min-min算法单纯追求局部最优的局限性,更适合异构环境。实验结果表明AS算法可以有效地降低调度跨度,其性能比Min-min算法有所提高。  相似文献   

12.
提出了一种基于启发式群聚算法的机器人全局任务调度策略,在任务划分阶段采用一种启发式群聚算法对随机划分的各子任务按能否使总的运行时间缩短进行各子任务间的聚合,以使各子任务粒度和相互之间的通讯量达到一种优化状态,并在此基础上对群聚之后的各子群任务采用集中式动态调度策略,在程序运行过程中实现各处理器的负载平衡,提高各处理器的利用率,缩短总的运行时间.在一个由5个DSP(digital signal processor)处理器组成的同构型松耦合MIMD(multi instruction multidata)并行处理平台上,对平面四自由度连杆机器人在关节锁定下的运动控制任务采用上述先随机划分,再聚合,最后集中式调度的方法进行了并行实时仿真实验,取得了满意的并行性能指标.  相似文献   

13.
多核处理器凭借着低功耗高性能的优势占据了市场.针对多核平台上并行实时任务,提出局部与全局EDF相结合的调度算法,其中任务的截止期划分、执行预算以及迁移时机由所设计的处理器带宽预留服务器决定.同时,提出了内存分配算法,该算法能够更好地为并行实时任务管理内存资源.实验结果表明新的调度算法具有更高的调度成功率.另外,在内存资源竞争的前提下,内存分配算法可以保证并行任务的实时性与系统稳定性.  相似文献   

14.
This paper presents an instruction scheduling and cluster assignment approach for clustered very long instruction words (VLIW) processors. The technique produces high performance code by simultaneously balancing instructions among clusters and minimizing the amount of inter-cluster data communications. The scheme is evaluated based on benchmarks extracted from UTDSP. Results show a significant speedup compared with previously used techniques with speed-ups of up to 44%, with average speed-ups ranging from 14% (2-cluster) to 18% (4-cluster).  相似文献   

15.
Linux的网络转发性能研究   总被引:11,自引:0,他引:11  
采用实验与性能"轮廓"相结合的方法,对千兆网络下对称多处理器Linux的NAPI模式转发性能进行研究,发现Linux的多处理器扩展性较差,其网络转发的性能瓶颈点是网络过滤模块,影响Linux性能和扩展性的主要原因是同步开销过大和处理器负载不均衡.为此,采用"中断亲和"的静态调度方法来均衡处理器负载,并降低调度引起的高速缓存命中失败率.改进了网络过滤模块,即减少了两个同步点,降低了同步开销.实验证明所提建议可提高Linux多处理器的性能和扩展性.  相似文献   

16.
考虑作业处理时延以及作业传输时延对调度器性能的影响,在RR调度算法的基础上提出了一种新的基于参数扫描应用的调度算法PRR,并对该算法进行了理论分析,得出了该调度算法不需要作业以及处理器的相关信息,且具有比较好的容错性的结论.利用网格仿真软件Gridsim对PRR调度算法的理论分析结果进行了验证,并将该算法与RR调度算法的性能进行了比较.结果表明,当时延较大时,PRR调度算法性能改善比较明显.  相似文献   

17.
在经典排序论中,一般都假设每个工件在任一时刻仅被一台机器加工,且每台机器至多仅加工一个工件。在这篇文章中,研究这样一类排序问题:每个工件可以被多个不同的机器子集加工,其加工速度对于不同的机器子集是不同的,被加工的工件假定是可以间断且是独立的。排序问题的性能测度是排序长度。在以上条件下求解这类问题算法被给出,对其计算复杂性也作了研究。  相似文献   

18.
并行后缀树的构造及查询算法   总被引:2,自引:0,他引:2  
针对生物信息领域中传统后缀树构造算法在时间和空间上的限制,从结构并行的角度提出了一种新颖的、适用于生物信息学应用的并行后缀树结构和相应的构造算法·该算法首先将给定字符串分成若干连续的片段,并在各个处理机上分别构造这些片段的后缀树,形成了一种分布于多个处理机上的并行后缀树结构·该并行算法不仅大大缩短了后缀树的构造时间,而且避免了主存大小的限制·经分析,其性能优于现有的任何一种并行算法·在此基础上,提出了一种高效的基于这种并行后缀树的字符串匹配算法,解决了传统后缀树的基本查询问题·  相似文献   

19.
基于EDF的实时数据库动态容错调度算法   总被引:1,自引:0,他引:1  
实时数据库系统的事务调度过程中,对于即将完成的事务的抢占会造成CPU时间的浪费,降低系统的性能.针对实时数据库中的周期性实时事务提出了一种PEA(preemptive estimate algorithm)软件容错调度算法,算法基于EDF(earliest deadline first)进行事务调度,并结合负载优化算法进行适当调整,采用抢占评估策略来确定是否允许事务抢占,以最大化系统的资源利用率.通过实验测试,证明其具有良好的性能,能有效提高事务的成功率.  相似文献   

20.
实时多处理器容错算法是实时系统研究领域的一个重要课题.提出了一个动态处理非周期实时任务的容错算法.提出了对待实时任务的基、副版本采用不同的处理器分配策略.对于基版本,尽量提前任务的开始时间;对于副版本,尽量延迟任务的开始时间.通过实验模拟研究了算法的性能.实验表明,算法调度的成功率跟处理器个数、任务数以及任务计算时间有关.与采用单一处理器分配策略相比,具有较高的调度成功率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号