首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
迭代式优化编译是针对当前复杂体系结构提出的一种有效的优化编译方法,当前不同的研究小组已经针对不同优化空间开发了各种迭代式优化编译方法,以求加速迭代过程,提高优化效率.他们大多数集中研究如何在给定的优化转换空间中更快地找到好的点.我们提出了另一种加速迭代过程的方法.它的思路是在一次测试运行中测试多个而非一个点,使得迭代式...  相似文献   

2.
数据流编程作为一种编程模式被广泛地应用于多核处理器系统,其多核处理器的并行调度和对主存的访问延迟对程序的性能有很大的影响.为此,结合X86多核处理器的特点,提出一种数据流程序的任务调度与缓存优化方法.任务调度优化首先在预处理阶段提高目标程序的局部性和并行粒度;然后利用数据流程序的数据并行、任务并行和流水并行优化核间负载均衡,并构造软件流水调度.缓存优化针对目标系统的层次性缓存结构特征,通过消除缓存伪共享减少多核并行运行时相互间的干扰,根据逻辑线程间的通信分布实现逻辑线程到处理器核的映射.以COStream作为数据流编程语言,输出经过编译优化后的目标代码.实验选取数字媒体领域典型的算法进行测试,测试结果表明,编译优化后的测试程序基本达到线性加速比,验证了编译系统的有效性.  相似文献   

3.
Java虚拟机在运行过程中使用即时编译器编译Java程序的热点方法,然后直接执行热点方法的本地代码.锁cache机制允许Java虚拟机将编译方法的本地代码锁在cache中,以提高编译执行时的指令cache命中率.通过分析Java虚拟机中编译方法的调用规律,得到编译方法的活跃时间段、平均大小和内存分布情况.基于编译方法的调用规律,给出Java虚拟机中的动态锁cache优化方法.在Java热点方法的活跃期将其本地代码段锁在cache中,以减少cache失效.最后,在龙芯3A的HotSpot虚拟机上实现了动态锁cache优化方法.实验结果表明,Java虚拟机中的动态锁cache优化方法能够使SPECjvm2008运行时的cache失效次数平均降低8.5%,性能平均提升4%.  相似文献   

4.
基于C语言扩展定义一种新的特定领域编程语言MISPC, 并描述其应用于多媒体和无线网络领域主流场景的特征, 利用Backus-Naur范式对其数据类型等进行描述. 针对该语言特点, 提出一个面向异构平台的编译框架, 以生成较高性能的目标代码. 结合领域中一个经典算法进行验证, 实验结果表明, 对比不同输入规模、 不同版
本的代码实现, 显著提高了领域开发的效率, 并可获得最高5.59倍的执行加速比. 通过定义相应高层语言并构建编译框架, 提供领域编程框架的系统解决方法和技术, 有效降低了领域编程和调试的难度, 提升了领域开发效率及程序性能.  相似文献   

5.
基于FPGA的一个超混沌系统设计与电路实现   总被引:16,自引:1,他引:15  
提出了一种基于FPGA新的实现超混沌系统的方法,利用Matlab/Simulink 中的DSP Builder工具箱设计了一个电路模型,仿真成功后,把模型文件转换成VHDL代码程序,对VHDL语言代码进行编译、仿真、配置后,用Quartus II下载到FPGA硬件电路中.结果表明新方法简单方便且能有效地产生超混沌吸引子.实验结果与仿真结果完全一致.  相似文献   

6.
针对基于虚拟机(virtual machine, VM)保护框架的代码隔离技术中所存在的单一隔离环境安全问题,提出一种三位一体协同虚拟机保护方案。基于Mealy自动机对核心代码和关键数据进行混淆转换,采用虚拟机框架进行保护,将关键数据和核心代码迁移至第三方安全环境,最后结合篡改恢复和自毁技术构建本地软硬件和远程云端三位一体协同保护方案,构建了模拟系统,并基于测试保护程序验证了该保护方案的有效性和可行性。  相似文献   

7.
为了有效地识别遗产代码中因横切关注点而导致的零散代码或交织代码,提出了一种基于程序依赖图的Aspect挖掘方法.根据横切关注点的本质特性,考察了横切关注点与核心关注点之间的依赖关系及其在依赖图上的表现形式,对于单个方法体,结合程序的语义信息,在程序依赖图中引入一个虚拟结点表征方法体的核心功能,所有影响核心功能的语句都与之建立依赖关系,然后对依赖图进行拓扑分析,先从虚拟结点开始分离出核心代码,再通过求解连通分量的方式挖掘方法体内横切代码.实例分析表明,该方法不仅能识别出方法体内的零散特性代码,而且还能有效地挖掘出交织特性的代码.  相似文献   

8.
针对目前程序设计中软件开发还没有编制程序的一套标准方法,编制程序代码的质量不高,效率也不尽人意,提出一种迭代增量式构造程序的方法,给出程序的迭代增量构造模型和实现机制,通过具体实例对相关问题进行了讨论。提供了一种能保证质量并且有法可循的程序构建方法。实践证明这种方法完全可以快速、高效构建一些较为复杂的程序,该方法的思想也同样适用其他类似的问题。  相似文献   

9.
谓词执行是有效挖掘控制流程序指令级并行性的一种机制.经典的谓词实现一般局部地逐个进行谓词计算而不能进行多谓词控制,有谓词计算路径过长等问题.针对经典谓词存在的问题,提出一种先进的扁平化谓词的实现方法,这种扁平化谓词可以全局地进行谓词计算,可以自然地进行多谓词控制.在此基础上,研究扁平化谓词的编译优化方法,给出了扁平化谓词编译优化框架.实验表明,本文提出的扁平化谓词及编译优化框架可以很好地提高多条件控制程序的执行效率.  相似文献   

10.
从改善性能的前提出发,对程序优化的一些基本思路作了归纳。讨论了分析代码结构的几种常用的方法,比较了三种底层策略,并提供了相应的范例代码。  相似文献   

11.
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库FitenBLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%.  相似文献   

12.
针对符号交织串行级联CPM系统中外码性能越好,接收端迭代译码后系统性能反而越差问题,研究了一种新型的符号交织串行级联CPM方案,该方案结合符号交织和比特交织的特点,在译码时延几乎不变前提下,对每一符号帧映射前的比特信息序列进行比特置换优化.相比符号交织串行级联CPM方案,采用本文所提的优化方案,能加快接收端译码迭代收敛速度,同时外码的性能也可直接影响到符号交织串行级联CPM系统的性能.  相似文献   

13.
乘积码的一种新的迭代译码算法   总被引:4,自引:0,他引:4  
乘积码是利用线性分组码实现长码的典范,能纠正大量的随机错误和突发错误,当以Turbo码的思想实现乘积码的迭代译码时,可获得很高的编码增益.针对乘积码提出一种新的迭代译码算法,该算法的反馈方式有别于Turbo码的传统迭代译码,是通过输出软信息与接收软信息进行线性叠加来实现的,此时子译码器的候选码字个数将大为降低,同时译码输出也无须做复杂的LLR计算,直接映射为由-1, 1组成的软输出矩阵,从而在牺牲较小性能的情况下很大程度地降低了译码复杂度.  相似文献   

14.
低密度校验码(LDPC)是一类线性分组纠错码,和积传递算法是LDPC码迭代译码算法中的常用算法.在此基础上研究了二进制对称信道(BSC)下LDPC码的消息传递迭代译码算法,对其误码特性进行了仿真,并用密度进化方法仿真了校验节点、变量节点的概率密度在迭代过程中的收敛情况.结果表明在给定的信道门限下LDPC码具有良好的纠错性能.  相似文献   

15.
德温特世界专利索引数据库(Derwent World Patent Index,DWPI)中收录的每份专利文献的每个专利权人均指定有4个字母的专利权人代码.专利权人代码通常以专利权人名称为基础确定.专利权人代码分标准代码(Standard Codes)和非标准代码(Non-Standard Codes).使用专利权人代码可以提高检索效率.该文对德温特专利权人代码的设置及编制规则进行了介绍,并就使用专利权人代码应注意的方面进行了分析.  相似文献   

16.
提出了一种新型的高性能的级联码.该码的内码采用递归系统卷积码,外码采用Tailbiting码.另给出了该编码的迭代解码算法,并通过计算机仿真,将其和普通的串行级联码在性能上进行了比较。  相似文献   

17.
C 代码优化技巧   总被引:2,自引:0,他引:2  
代码优化是程序设计中的重要环节,在算法一定的前提下,优化的代码要比没有经过优化的代码执行效率更高,特别是在对大量数据操作的时候。本文就如何编写高质量的c 代码进行简单的介绍。  相似文献   

18.
带钢退火过程中存在多变量非线性主导因素和数据噪声,难以用数学模型精确描述退火炉内带钢的延伸量.针对这一问题,提出基于核主元分析(KPCA)与免疫粒子群(ICPSO)优化最小二乘支持向量机(LSSVM)的炉内带钢延伸量软测量方法.采用ICPSO算法避免了粒子群算法易陷入局部最优的缺陷,利用ICPSO对LSSVM进行参数寻优,通过KPCA去除样本噪声,提取输入数据样本中的非线性主元信息,建立ICPSO-LSSVM软测量模型.此方法用于退火炉内带钢延伸量预测,通过现场生产数据仿真实验进行非线性函数估计;对比其他几种现有算法,实验结果表明本文方法具有较高的预测精度.  相似文献   

19.
Linux的核心代码大部分是用C语言编写的,不可避免的其中还有一部分是用汇编语言写成的.有些汇编语言代码是利用gcc的内嵌语句直接嵌在C语言程序中的;还有一些则是写在汇编源程序中的,特别是Linux的启动代码部分,文章介绍了在Linux的gcc/g 环境下,C/C 程序中如何内嵌汇编代码;分析了汇编源程序如何与调用它的C/C 程序接口。  相似文献   

20.
A novel product code iterative decoding algorithm and its high speed implementation scheme are proposed in this paper.Based on partial combination of selected columns of check matrix,the reduced-complexity syndrome decoding method is proposed to decode sub-codes of product code and deliver soft output information.So iterative decoding of product codes is possible.The fast sorting algorithm and a look-up method are proposed for high speed implementation of this algo-rithm.Compared to the conventional weighing iterative algorithm,the proposed algorithm has lower complexity while offering better performance,which is demonstrated by simulations and implementation analysis.The implementation scheme and verilog HDL simulation show that it is feasible to achieve high speed decoding with the proposed algorithm.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号