首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
对面向G级像素帧处理的高效实现,提出一种基于SIMD PE阵列的Daubechies 9-7提升小波变换的数据并行实现方案.针对提升小波变换的不同提升阶段,采用阶段内并行、阶段间串行的处理方式,避免了阶段内处理中的数据相关,大幅度地提高了处理的速度.为减少多层分解变换中PE间通信开销,采用行、列动态PM2I网互联结构,实现了不同分解层次中相关PE间的直接互联,降低了各层变换中PE间的通信次数,满足了大图像帧实时性处理的要求.  相似文献   

2.
为简化几何操作数据并行实现的复杂度,特别是简化几何操作中重采样数据并行实现的复杂度,提出了通过SIMD(Single Instruction Multiple Data)处理元阵列内的数据并行传送,而不是通常所采用的处理元阵列与阵列存储器之间的数据流传送实现几何操作的处理方法.讨论了几何操作正向映射的零阶内插与一阶内插的数据并行实现方法;几何操作反向映射的零阶内插与一阶内插的数据并行实现方法;以及正向映射与反向映射的3种特殊情况.结果表明,该方法使几何操作的数据并行实现方法的复杂性为O(M N),而不是数据流传送实现方法的O(MN),从而更好地满足了数字图像快速实时处理的需要.  相似文献   

3.
以导引头图像处理工作为应用背景,分析了图像数据与处理器之间的映射关系,并在此基础上给出数据传送指令功能的定义,研究了SIMD系统结构参数,提出如何正确选择PE数据路径宽度,存储器访问带宽和局部存储器容量,研究结果对我国并行技术的发展具有一定的借鉴意义。  相似文献   

4.
一种并行结构的H.264帧内预测器   总被引:7,自引:0,他引:7  
提出了一种基于可重构设计的并行结构的H.264帧内预测器.在分析17种帧内预测值求解算法的基础上,利用其运算上的相似性,将所有运算单元集中到一个运算单元中.该运算单元可根据预测模式的不同对输入的数据安排相应的运算模块及数据通路,从而达到资源的最优化利用.在实际应用中,为了达到适时解码,系统同时安排4个并行运算单元以提高处理能力.实验表明,在50.5 MHz时钟时,本结构可以适时处理720×480,30帧/s的图像.  相似文献   

5.
针对读取数据这一制约绘制性能的主要因素,从时变数据场的相邻帧相似性入手,利用前一帧图像的绘图区域预测下一帧图像的绘图区域,进而转换成I/O参数,实现连续绘制中的数据预取.并在多帧图像绘制过程中形成载人、处理、绘制三级流水线,提高可视化的速度.微机测试表明,由于图像相邻帧相似度的不同,时变可视化数据预取将可视化性能提高17.2%~47.5%.  相似文献   

6.
针对环形去最大中值滤波和帧间轨迹关联红外小目标检测算法流程与现场可编程门阵列(FPGA)并行不兼容的问题,对原有算法进行了并行化改进.主要从简化阈值计算、采用上一帧统计值进行自适应阈值分割和多帧检测循环三个方面进行了优化.在对检测性能影响较小的前提下,通过对算法结构进行优化,消除了算法中全局计算依赖,使其更适于FPGA进行算法实现.以FPGA实现优化后算法时,在80 MHz工作时钟下,处理2 800×2 800像素图像能够达到10帧/s的速度,满足大部分实时红外探测系统的要求.  相似文献   

7.
基于TMS320C80的视频图像处理系统的研制   总被引:6,自引:0,他引:6  
目的 研究基于多处理器的并行运算在图像处理中的应用,方法 建立TMS320C80硬件平台,采用C语言与两种汇编语言混合编程的方法实现图像蝗并行处理,结果 该图像处理系统能够完成图像的实时处理,进行边缘提取的速度可达到30帧/s,采用互相关模板匹配方法进行跟踪的速度可达到14帧/s,结论 基于多CPU的并行运算可以对图像进行实时处理,减少硬件系统的复杂性,并行运算的效率主要由多个任务在多个处理器上的  相似文献   

8.
基于很多大数据应用存在对数据进行多种并行处理的需求,提出两层混合式并行方法,即执行单元的混合并行和计算模型的混合并行.通过在同一个计算节点上执行单元的混合并行,充分挖掘基础设施的计算能力,从而提高数据处理性能;采用在同一个执行引擎中集成多个计算模型的并行方法,以适合应用多样异质处理模式.不同的混合并行方法可以契合不同的数据和计算特点,以满足不同的并行目标.介绍了混合式并行方法的基本思想,并以前期开发的并行编程模型BSPCloud为基础,阐述了进程和线程混合并行、BSP和Map Reduce混合并行的主要实现机制.  相似文献   

9.
 在医学超声成像系统中由于超声波在人体组织内传播会发生衰减,需要对超声图像进行有效的增益补偿,使超声图像的显示效果更好。但大多数自动增益补偿算法在处理时涉及大量的复杂计算,成为临床实时成像系统中的一大性能提升瓶颈,为此提出了一种基于高性能并行计算平台Fermi架构图形处理单元(GPU)的自动增益补偿并行处理算法。本算法主要的处理流程有数据预处理、区域类型检测、组织强度计算、二次曲面拟合以及自适应增益补偿等部分,核心的并行算法设计包括了粗粒度的并行均值滤波、局部方差系数的并行计算、优化的矩阵转置并行实现以及基于LU分解的粗粒度的矩阵求逆的并行实现等方面。数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的增益补偿效果,而且可以取得较大的加速效果,满足实时系统需求,对512×261的图像数据能够达到427帧/s的高帧率,速度提高了大约267倍。  相似文献   

10.
为提高运动目标的检测与跟踪处理速度,设计了一个基于网格计算的解决方案,应用网格计算以分布并行方式来处理图像序列. 网格计算节点上执行的一个任务对应处理图像序列中的一个帧图像单元,一个帧图像单元包含了每次处理过程中所涉及的一帧或多帧图像,因而网格计算中的任务数即为图像序列中的帧图像单元数. 利用Condor系统搭建了一个网格计算试验台,开发了一个用户交互界面和若干中间件服务模块. 以基于相邻帧差法和模板匹配法的运动背景下的目标检测和跟踪算法为例进行了试验. 试验结果表明,该方案具有可行性,并能大幅度缩减计算时间,提高处理效率.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号