首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
DSP汇编语言优化设计   总被引:1,自引:1,他引:0  
执行效率是衡量DSP程序的性能的重要指标,因而程序的优化就显得十分必要.在TS201的环境下,基于汇编语言,结合MTI(动目标显示)的程序对SIMD(单指令多数据)技术、利用或避免延时、加强指令级并行、软件流水、循环展开等优化方法进行了比较和分析.优化后的汇编程序的效率提高了48.5%.  相似文献   

2.
OpenMP中隐式数据并行编译策略   总被引:1,自引:0,他引:1  
为了实现OpenMPFortranAPI2.0中通过WORKSHARE语句提供的对隐式数据并行的支持,提出了计算划分原则、计算划分算法以及实现方案。还给出了针对编译中产生的冗余同步以及相容的DO循环等情况的优化技术。将实现方案与EFC(Intel产品编译器)进行了对比测试。结果表明,该并行编译策略有效地实现了对隐式数据并行的支持。所述优化技术能够提高并行程序执行效率:消除冗余同步对于负载不平衡的情况所提高的效率与各线程最小总等待时间成正比;合并循环体能提高7%左右的效率。  相似文献   

3.
基于数据依赖关系的程序自动并行化方法   总被引:1,自引:0,他引:1  
针对目前大量串行遗产程序无法在高性能并行计算机上高效运行的问题,提出一种基于数据依赖关系分析技术的程序自动并行化方法,采用数据依赖关系分析技术对串行程序进行分析,将串行程序中基本块分成两类:彼此间具有依赖关系的基本块和彼此间无依赖关系的基本块,通过对无依赖关系的基本块进行并行处理实现串行程序的自动并行化,从而解决了在对串行程序自动并行处理时开销增大的缺点,并得到较好的并行优化结果.实例分析结果表明,该方法可以识别出可并行执行的基本块,实现串行程序的自动并行化.  相似文献   

4.
采用计算任务量大小的方法,解决了在紧嵌套循环自动并行化过程中存在循环并行化的并行粒度确定问题以及循环自动并行化中数据划分的数据访问局部性问题,在多核系统中实现了紧嵌套循环自动并行化时的数据访问局部性方案和并行化方法,从而构造了一个基于任务量划分的循环自动并行化模型,降低了程序自动并行化中小任务量并行带来的开销.  相似文献   

5.
一般任务图很难表示多重相关循环语句中不同循环迭代之间的相关关系.本文首先介绍了循环任务图的基本概念,然后说明了如何通过循环展开技术来产生复制任务图,从而把循环传递相关转换为循环独立相关,最后并给出了MIMD-DM模型上寻找最优循环展开向量的目标函数  相似文献   

6.
构建了面向分簇体系结构的模调度编译框架.介绍了分簇结构和支持向量化执行的体系结构的机器资源描述方法,研究了模调度和循环展开的关系,并给出循环展开的有效性条件判断,提出了向量化体系结构下模变量扩展算法框架,有效解决该体系结构下模调度的代码生成问题.实验结果表明,提出的面向分簇向量化体系结构的模调度编译框架,可以大幅提升程序循环部分的性能,加速比为170%~680%.  相似文献   

7.
为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略。在采用LL(1)方法实现自顶向下语法分析的并行编译中,LL(1)分析表的生成一直处于关键地位,由于文法中的终结符和非终结符个数很多,分析表的构造成为提高语法分析速度的瓶颈问题,因此考虑采用LL(1)分析表的并行生成。算法采用多线程的工作模式,并借助于线程间的通讯机制实现,此并行处理方法对编译的并行处理和提高效率有理论和现实意义。  相似文献   

8.
程序框图与源代码的自动转换是软件工程领域研究的一个重要课题,实现这种转换有不同的技术和方法.一个可选的方法是首先对程序框图之间的各种关系及其含义进行解析,将之分解为顺序执行关系、判断嵌套关系、循环嵌套关系和跳转嵌套关系,在此基础上生成一个自动转换系统.该系统包括用户接口控制模块、图形符号解析模块、代码生成模块、编译执行模块等.自动生成的仿C语言程序在本系统开发环境中能正确运行.  相似文献   

9.
提出一种基于FPGA的三级递阶结构的电脑横机系统控制方案.在该体系中,花型准备系统是基于Windows的开放式编程系统,通过编译自动生成编织指令数据文件.控制系统通过构建电脑横机编织过程的工艺执行子系统,代替多CPU器件的互联.工厂实践证明,它具有集成度高,稳定性好,实时性强的优点.FPGA的可重载性及并行工作方式使很多软件层的工作可以由硬件实现,提高了系统的可靠性及可移植性.  相似文献   

10.
JBPM在流程的推进过程中要选择相应的路径进行流转,其中并行路由是一种最为复杂的路径选择方法.但初始化路经参数时,并行路由算法节点定义复杂,需要预先定义子路径流程模板,并且逐一对XML文件节点赋值导致效率较低.针对这一问题,提出了一种基于JBPM与角色分组的并行路由算法.该算法引用角色分组的理论,通过运用角色查询单个分组的方法将并行路由分支参数初始化,生成多个并行子路径节点信息,进而将每个节点信息分组存放数据库中,对数据进行统一处理,提高初始化子路径参数的效率.改进后的算法应用到房地产OA办公系统的请假会签功能中,在实践上取得良好效果,满足业务流程灵活多变的需求.  相似文献   

11.
由于相邻节点间存在数据依赖关系,基于最小误符号率(Bahl Cocke Jelinek Raviv,BCJR)算法的累积码译码器无法进行多个节点的并行计算.为了提高译码器吞吐量,研究提高BCJR算法并行度的方法,通过将累积码分段,并在不同分段间传递上一次迭代的信息,属于不同分段的多个节点可以并行计算,使译码器的吞吐量得...  相似文献   

12.
提出了一种基于用户指导法的异构计算的动态实现工具,称为粗粒度异构预编译器(CHP),定义了5种用户在并行编程时需显式说明的代码段的类型,以及用户对代码段的输入和输出参数需进行的说明。  相似文献   

13.
稠密正规语言的S.Y猜想的一些等价刻划   总被引:1,自引:0,他引:1  
一个语言称为正规的如果它可被一台有限自动机识别,一个语言称为稠密的如果每个字都是该语言中某个字的一个小字,一个非空字称为本原的,如果此字不是其他任一字的幂,否则称此非空字为非本原字,Shyr和Yu在[3]中给出如下猜想:每个稠密正规语言都包含一个非本原字,如果能给出S.Y猜想在半群理论及码论中的等价陈述,则可把稠密正规语言的问题归结为半群理论及码论中的问题,从而为解决S.Y猜想提供了更多的途径。  相似文献   

14.
设w是{0,1}上一个无限字,若x是w的子字,且|x|≥k(k为正整数),则x的补字x不是w的子字,那么称w是一个k补子字自由的无限字.文章给出了k补子字自由无限字的若干刻画.  相似文献   

15.
具有高速并行译码结构LDPC码的构造   总被引:1,自引:1,他引:0  
针对可实现高速并行译码的低密度校验(LDPC)码,提出了一种LDPC码的构造方法.该方法用代数的方法构造一个校验矩阵,适当地选择构造时的参数,可以消除校验矩阵中的小环,以保证所构造码字的性能;再按照一定的规则对所构造校验矩阵的行进行重新排列,可使得重排后的矩阵具有分块结构.仿真结果表明,采用这种分块结构,使得LDPC码的部分并行译码在工程实现上成为可能,按照该方法构造的LDPC码的性能与随机构造的码字相当.  相似文献   

16.
为进行分组密码并行处理的理论研究和定量分析,构建了基于Amdahl定律的分组密码并行处理模型.通过引入分组内数据级并行性、分组内指令级并行性、分组间数据级并行性和分组间指令级并行性等并行性,建立了分组密码的多维度并行处理模型,研究了算法参数和并行参数对分组密码处理性能的影响.结果表明,并行比例大的算法其性能提升空间较大,且开发任一并行性都能够提升密码运算性能;但对于具体的应用场景,需要根据算法结构、工作模式等来进行合理的资源配置和并行性开发;该模型能够为分组密码算法的并行处理架构设计、资源配置和并行性开发等提供理论依据和指导原则.   相似文献   

17.
介绍了一种利用TI公司的超低功耗单片机MSP430实现由(2,1,4)卷积码生成的最佳增信删余码(Punctured Codes)的编码与其Viterbi译码的技术.首先简要介绍了由(2,1,4)卷积码生成的最佳增信删余码的编码原理与解码方法,其本质上是为了降低码率和冗余信息而牺牲码的性能的一种做法.译码采用了Viterbi算法.本文的目标是尽量用较快的速度、较少的硬件资源达到用单片机来实现卷积码的编码与Viterbi译码.在本文中详细介绍他们的实现方法.  相似文献   

18.
给出了一种采用SSE(Streaming SIMD Extensions)技术实现矢量化模拟电子在人体组织中输运的蒙特卡罗方法,并对一个计算放疗剂量分布的蒙卡特罗代码DPM进行了实施,将DPM模拟电子的方式由原来的一个个顺序模拟改为一次模拟4个电子,这4个电子进行同一个动作时,这部分程序可借助于SSE指令实现并行处理。计算结果显示,在不增加任何硬件成本的情况下,可以提高计算电子剂量分布的速度1.8倍左右。  相似文献   

19.
针对多天线系统中的信道估计,提出了一类周期互补多相码的构造方法。该方法基于完美码集合,通过对集合中任意2个等长完美码的交织操作,可以获得一类新的具有周期互补特性的多相码。所获得的多相码具有理想的周期相关性能,即该类多相码的异相周期自相关函数和任意位移上的周期互相关函数都等于零。不同于传统的子码长度受限的周期互补二元码,所构造的周期互补多相码能够产生大于4的所有偶数子码长度,从而既可以保证系统信道估计的性能,也可以提供更加灵活的参数选择。  相似文献   

20.
An efficient method for parallel CRC automatic generation   总被引:1,自引:0,他引:1  
The State Transition Equation (STE) based method to automatically generate the parallel CRC circuits for any generator polynomial or required amount of parallelism is presented. The parallel CRC circuit so generated is partially optimized before being fed to synthesis tools and works properly in our LAN transceiv-er. Compared with the cascading method, the proposed method gives better timing results and significantly re-duces the synthesis time, in particular.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号