首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
蔡兴文 《科学技术与工程》2012,12(35):9540-9544
为了简化对地观测地面系统遥感数据并行处理软件的开发工作,在分析遥感数据处理流程、并行任务调度和容错策略的基础上,设计了遥感数据并行处理框架。该框架集成了遥感数据预处理并行任务调度、消息和数据交换、故障管理等公共功能,并设计实现了简单易用的插件接口规范,以支持多载荷、多种遥感数据预处理功能的扩展以实现并行处理,具有较好的通用性和功能扩展性。最后基于消息传递接口(MPI)技术,在集群上实现了遥感数据处理并行框架,并在此框架上实现遥感数据预处理的并行系统,完成了系统并行性能测试与分析,结果表明该框架在简化遥感数据预处理并行功能开发的同时还能满足遥感数据并行处理效率要求。  相似文献   

2.
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。  相似文献   

3.
通过对 5 4Mbps无线局域网中满足时限业务需要的周期查询控制方式进行分析 ,对周期查询系统的调度策略做了改进 ,将传输服务与转移查询做了并行处理 ,并结合无线局域网上语音和视频多媒体业务 ,讨论了系统的性能  相似文献   

4.
数据流编程作为一种编程模式被广泛地应用于多核处理器系统,其多核处理器的并行调度和对主存的访问延迟对程序的性能有很大的影响.为此,结合X86多核处理器的特点,提出一种数据流程序的任务调度与缓存优化方法.任务调度优化首先在预处理阶段提高目标程序的局部性和并行粒度;然后利用数据流程序的数据并行、任务并行和流水并行优化核间负载均衡,并构造软件流水调度.缓存优化针对目标系统的层次性缓存结构特征,通过消除缓存伪共享减少多核并行运行时相互间的干扰,根据逻辑线程间的通信分布实现逻辑线程到处理器核的映射.以COStream作为数据流编程语言,输出经过编译优化后的目标代码.实验选取数字媒体领域典型的算法进行测试,测试结果表明,编译优化后的测试程序基本达到线性加速比,验证了编译系统的有效性.  相似文献   

5.
基于CUDA的H.264/AVC视频编码的设计与实现   总被引:1,自引:0,他引:1  
为了提高编码速率,将视频编码中计算量较大的运动估计和离散余弦变换(DCT)系数计算移植到图像处理器(GPU)上处理.根据H.264/AVC的编码要求和处理器的并行结构,提出了一种并行处理方法,并利用统一计算设备架构(CUDA)的计算平台,实现了H.264/AVC中的运动估计和DCT变换系数的计算.实验表明:在GPU上采用并行计算方法可较大程度地提高视频编码速度.  相似文献   

6.
对于大数据量图像和复杂图像处理算法,并行处理是一种有效的解决方法.基于消息传递接口,设计了一种并行图像边缘检测算法,并在曙光4000L并行机上予以实现.数值实验结果表明,并行图像处理能显著减少计算时间,更多的计算节点能得到更大的加速比,该并行图像处理算法对于大数据量图像更加有效.  相似文献   

7.
针对Gdel语言成分复杂,难以采用Prolog语言的并行推理策略,给出了基于该语言程序中间代码的并行推理模型,并对该并行模型的加速效果进行了分析,结果表明新提出的Gdel并行策略具有良好的加速比.  相似文献   

8.
加速鲁棒特征算法(speed up robust features,SURF)的时间复杂度大,传统串行计算的方法,实时性难以保证.针对上述问题,提出一种基于OpenCL架构的SURF并行实现方法.首先对算法中的积分图的计算、Hessian响应图、特征点主方向、特征点描述等步骤实施数据并行和任务并行处理,并给出详细的算法流程.接着从OpenCL架构的数据传输、内存访问以及负载均衡等方面优化算法性能.实验结果表明,该算法对不同分辨率的图片均实现了10倍以上的加速比,一些高分辨率的图片甚至可以达到39.5倍,并且算法适用于多种通用计算平台.  相似文献   

9.
基于多线程的计算机硬件虚拟实验室的设计与实现   总被引:5,自引:0,他引:5  
研究了计算机硬件虚拟实验室的设计与实现方法.系统采用多线程技术实现虚拟计算机的仿真运行、信号检测、信号图形化编码及信号输出4个功能模块的并行操作功能,采用加锁技术实现多线程运行的同步控制;根据系统运行时间的特点、模块的交互性、线程间优先关系,设定各线程的优先级别,按优先级别与给定时间片进行线程调度;模块间传送数据的同步控制通过多数据缓冲区机制实现,利用事件驱动方式完成各缓冲区数据的传递.系统采用多线程与多缓冲区技术相结合的方式,实现了计算机硬件虚拟实验系统模块的并行操作与数据的并行处理,提高了系统的交互性和运行效率,为计算机硬件实验教学提供了一个高度交互与仿真的虚拟实验环境.  相似文献   

10.
浮动车数据(floating car data, FCD)技术是大规模城市路网交通流实时采集的有效方法.城市交通的动态诱导和控制需要对海量FCD进行快速处理.鉴于此,提出了FCD并行计算的动态任务调度方法.针对FCD数据包计算时间的不确定性和动态性,根据计算节点的处理能力进行数据包的动态分割,在处理过程中,采用动态任务分配策略以实现计算节点的同步.该方法在龙芯国产大数据一体机平台上进行了实现,并采用现场FCD数据进行了实验验证,结果表明,该方法较轮询和Min-Min调度算法,显著地提高了并行处理的性能.  相似文献   

11.
In order to improve the concurrent access performance of the web-based spatial computing system in cluster,a parallel scheduling strategy based on the multi-core environment is proposed,which includes two levels of parallel processing mechanisms.One is that it can evenly allocate tasks to each server node in the cluster and the other is that it can implement the load balancing inside a server node.Based on the strategy,a new web-based spatial computing model is designed in this paper,in which,a task response ratio calculation method,a request queue buffer mechanism and a thread scheduling strategy are focused on.Experimental results show that the new model can fully use the multi-core computing advantage of each server node in the concurrent access environment and improve the average hits per second,average I/O Hits,CPU utilization and throughput.Using speed-up ratio to analyze the traditional model and the new one,the result shows that the new model has the best performance.The performance of the multi-core server nodes in the cluster is optimized; the resource utilization and the parallel processing capabilities are enhanced.The more CPU cores you have,the higher parallel processing capabilities will be obtained.  相似文献   

12.
With the development of general-purpose processors (GPP) and video signal processing algorithms, it is possible to implement a software-based real-time video encoder on GPP, and its low cost and easy upgrade attract developers‘ interests to transfer video encoding from specialized hardware to more flexible software. In this paper, the encoding structure is set up first to support complexity scalability; then a lot of high performance algorithms are used on the key time-consuming modules in coding process; finally, at programming level, processor characteristics are considered to improve data access efficiency and processing parallelism. Other programming methods such as lookup table are adopted to reduce the computational complexity. Simulation results showed that these ideas could not only improve the global performance of video coding, but also provide great flexibility in complexity regulation.  相似文献   

13.
近年来,随着人们对视频数据需求的不断增加,视频的分辨率和帧率也在不断地提高,而实时视频序列的压缩编码速度往往受到帧率和分辨率的影响,分辨率和帧率越大,编码所需要的时间越长。为了实现更高分辨率和更高帧率的视频序列实时压缩编码,文中设计了一种新的帧内率失真优化预测模式的并行流水线硬件架构,该架构支持最大64×64编码树单元的帧内预测编码。首先设计了9路预测模式并行方案;然后,按照Z型扫描顺序实现以4×4块为基本处理单元的流水线硬件架构,并复用32×32预测单元的预测数据,用以代替64×64预测单元的预测数据,减少运算量;最后,基于该流水线架构,提出了一种新的哈达玛变换电路,用以实现高效的流水线处理。实验结果表明:在Altera Arria 10系列的现场可编程门阵列上,该9路模式并行架构仅占用75 kb的查找表和55 kb的寄存器资源,主频可以达到207 MHz,完成一个64×64编码树单元的预测仅需要4 096个时钟周期,最大能够支持1 080 P分辨率99 f/s全I帧的实时编码;与已有设计方案相比,文中方案能够用更小的电路面积实现更高帧率的1 080 P实时视频编码。  相似文献   

14.
为满足实时视频通信系统的连续性和传输速率, 提出对视频数据进行H.264编码并通过流媒体方式进行无线传输的方案。系统采用S3C6410内部自带的硬件编解码模块MFC(Multi Format Codec)进行H.264标准的硬编码, 并深入研究了H.264视频数据基于实时传输协议(RTP: Real-time Transport Protocol)的打包方式及网络传输方法, 最终通过Wi-Fi网络发送到接收端, 实现了C/S架构下的H.264视频传输。测试结果表明, 该系统满足实时视频通信的要求, 硬编码的帧率达到30帧/s, 同时具有压缩比高、 传输稳定等优点。  相似文献   

15.
从数据处理、存储器访问以及地址计算等方面详细分析了现有MPEG-4视频编码系统的运算复杂度,并对MPEG-4视频编解码算法的数据处理和数据传输性能进行了分析.在此基础上对MPEG-4视频编解码器的结构进行了优化设计,并给出一个优化后的实时MPEG-4视频编解码系统结构.通过分析发现:利用软件实现该结构下的MEPG-4编解码能有效的利用计算资源,达到提高系统性能的目的.  相似文献   

16.
SAR实时成像处理系统的定点化优化能够减小系统存储规模、提高系统运算速度,是降低系统功耗、减小系统规模、提高实时性的有效方法.本文以CS成像算法为例,分析并统计了算法的运算量,针对其核心运算--FFT进行了定点化优化,选择基-22FFT算法,设计了合理的定标策略.采用SystemC语言对整个SAR成像系统进行了系统级快速仿真和验证,真实模拟了FPGA系统的实现结果.对16 384×16 384大小的点阵数据和面目标数据采用24 bits的字长进行了成像仿真,仿真结果满足系统指标要求.   相似文献   

17.
针对多任务运行环境下程序执行时间的不确定性会产生响应时间不可预测性的问题,基于虚拟仪器系统结构及实时工作条件,建立虚拟仪器的响应时间模型,确定实时性能评价指标,推导各时间分量的迭代计算公式,采用读取硬件时钟周期数方法实现代码执行时间获取,系统地评测虚拟仪器实时性能指标。基于数据处理超过规定完成时限的时间分析,表明增强数据处理任务的CPU竞争能力和提高计算机平台的硬件配置是实时性能优化的有效方法。相关的实验结果也证实了实时性能评测和优化方法的有效性,通过实验数据分析,推导出在给定实际数据处理时间和按规定时限完成工作周期比例系数的条件下的最大数据采集频率估算公式,可使虚拟仪器在运行效率高达80%的负载条件下,保持稳定的实时性能。  相似文献   

18.
针对传统多路视频监控系统控制不灵活,处理速度慢,系统无法对各路视频信号进行视频算法等问题,介绍了一种采用FPGA设计多路视频实时处理和显示的系统方案. 通过使用单片FPGA硬件方式实现多路视频的采集、格式转化、视频缓存、视频算法处理、视频拼接和显示,并可以进行多路视频与其中任意一路视频切换显示和处理,同时系统支持对每一路视频进行不同的算法处理. 该方案利用FPGA的并行处理能力,可以实时处理和显示4路视频,帧频达到了15帧/秒,每一路视频信号的处理时间不超过4 ms. 该方案具有低成本、低功耗、实时性好、扩展性强等特点,适用于目前常用的视频监控应用场景.  相似文献   

19.
由于去块滤波运算数据量庞大的特点以及视频解码实时性的要求,近年来,去块滤波运算的硬件加速器已逐渐成为研究的热点。从兼顾系统的灵活性与性能的角度出发,设计了一种可重构去块滤波器。与传统的支持单一标准的去块滤波硬件加速器相比,该滤波器具有以下优点:实现了一种滤波算法可配置的滤波器结构,从而可以支持多个视频编码标准;采用了基于SIMD单指令多数据流技术,实现滤波数据全并行运算,使硬件高度规整,易于芯片布局布线;设计了1个4级可配置的流水线,重构为不同视频标准的去块滤波器,复用硬件资源,提高了硬件利用率和系统数据吞吐量。用这种架构实现了1个同时支持H.264、AVS、VP8、RealVideo 4种标准的多标准去块滤波加速器,时钟频率为200 MHz,能够用于多标准高清视频的实时滤波处理。  相似文献   

20.
 流式处理器针对数据并行的应用,提供多个简单的处理单元及它们之间的高带宽通道,通过高计算密度掩盖传输延迟,支持高速的数据传输和处理,与通用处理器相比,性能达到了数倍乃至数百倍的提升。在流式处理器的研究中,数据流的调度是个比较重要的问题。本文提出了一种基于拓扑特征的数据流调度策略,该策略包含平分策略和选择策略两种,其中平分策略用于体系结构中固有负载较少的情况,选择策略在固有负载较多时利用拓扑权重来辅助平分策略完成数据流任务的调度。建立了该策略的性能模型,在考虑节点间传输时间的情况下进行讨论,对数据流调度策略的选择提出建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号