首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于循环展开的子字并行指令自动生成
引用本文:王淼,王志英,沈立,戴葵.基于循环展开的子字并行指令自动生成[J].华中科技大学学报(自然科学版),2008,36(2):46-49.
作者姓名:王淼  王志英  沈立  戴葵
作者单位:国防科技大学,计算机学院,湖南,长沙,410073;国防科技大学,计算机学院,湖南,长沙,410073;国防科技大学,计算机学院,湖南,长沙,410073;国防科技大学,计算机学院,湖南,长沙,410073
摘    要:针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子字并行的循环进行优化,生成子字并行代码.首先识别出可并行的循环,然后通过循环展开、寄存器重命名、指令合并等技术来提升循环体基本块中的子字并行性.在TTA(transport triggered architecture)体系结构的编译框架下用该方法实现了子字并行指令的自动生成.实验表明该方法得到了较好的加速比.

关 键 词:向量编译  子字并行  并行指令  循环展开  代码自动生成
文章编号:1671-4512(2008)02-0046-04
收稿时间:2006-08-01
修稿时间:2006年8月1日

Automatic code generation of subword parallelism based on loop unrolling
Wang Miao,Wang Zhiying,Shen Li,Dai Kui.Automatic code generation of subword parallelism based on loop unrolling[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2008,36(2):46-49.
Authors:Wang Miao  Wang Zhiying  Shen Li  Dai Kui
Abstract:Well-known parallelization techniques can be used to exploit subword parallelism. Loop unrolling, register renaming and induction variable expansion prove to be valuable to achieve this goal. We evaluated the performance of the code generated by our method for a number of benchmarks. The results reveal that our compiler produces a performance improvement over the code generated without the subword parallelism.
Keywords:vector compile  subword parallelism  parallel instructions  loop unrolling  automatic code generation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号