首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
提出了一种基于时间抽取原位计算的高效并行的二维矢量基2×2快速傅里叶变换的硬件实现结构.该算法结构将N×N点数据分解为4个独立存储的部分来实现矢量基2×2蝶形计算单元4个操作数的并行访问,仅用一个二维分裂基蝶形运算单元对这4块数据进行二维矢量基快速傅里叶变换,利用无冲突访问方法完成对存储器的并行访问.推导出了该算法硬件实现结构下的各存储器数据地址存取公式和旋转因子的产生方法,并利用CORDIC算法实现旋转因子的产生来减少存储器的使用.该算法对N×N点数据进行二维离散傅里叶变换处理的时间仅为(N2/2)(lb N-1)个时钟周期,与以往算法计算时间的比较结果表明了该设计的有效性.  相似文献   

2.
为了提高嵌入式多媒体应用的实时性能,提出了一种最大化数据并行访问以便充分发挥CPU处理能力的片上存储器分配方法。CPU指令的并行数据访问以及CPU与直接存储器存取(DM A)的并行访问都可能导致冲突,片外存储器的慢速存取也会导致CPU流水线停止。根据CPU处理数据的需要分配片上存储器,采用DM A动态地将数据转移到片上,减小存取慢速片外存储器带来的延时;充分利用CPU多条数据总线并行访问多个存储器块的能力和双端口存储器(DARAM)一个周期两次访问的能力,减小存储器带宽的限制。实验结果表明:合理分配存储器,程序执行时间最多减少了48%。存储器分配该方法简单,易于实现。  相似文献   

3.
针对目前视频解码器实现方案存在的灵活度低、开发周期长、不能适应快速变化的算法升级等问题,提出一种面向多种视频编解码标准的通用视频解码器架构设计方案.采用软硬件协同设计方法,基于可编程同构多核处理器+协处理器的硬件架构,同构多核处理器采用指令级和任务级并行加速,协处理器采用硬件定制单元实现矢量加速,同时利用分布式片上便笺式存储器(Scratchpad Memory,SPM)代替数据Cache实现高效的数据存储系统,以应用广泛的H.264视频标准为验证实例.实验结果表明,基于本文所提架构实现的H.264视频解码器高效可行,平均并行加速比为9.12,相比于传统多核并行解码算法提高了1.31倍.  相似文献   

4.
提出一种基于图形处理单元(Graphic Processing Unit,GPU)的不可压缩流体并行模拟算法.该算法使用并行基数排序技术提升了邻居查找效率,同时使用了GPU上的片上高速共享存储器,将流体计算过程中所需用到的数据尽可能从GPU的全局存储器中拷贝至共享存储器中,减小数据访问延迟,提高模拟效率.实验结果表明,基于GPU的并行模拟算法可以大幅提高流体模拟程序的性能,与基于CPU的单线程实现相比,可以到达38.2倍的加速比.  相似文献   

5.
双空间存储器是2013年发明的新型存储系统,其核心是内存空间在巨大的双空间存储器上的映射理论——内存推移理论.介绍了所构建的第一个双空间存储器实物系统,并在该系统上首次实施了内存推移理论.完成了对双空间存储器和推移锁存器组的实物设计及实现,并在实物实验系统上成功实施了内存推移操作,从而证实了将内存空间在双空间存储器上推移的理论的正确性,成功解决了内存空间与巨大的双空间存储器随机访问空间的对接问题,奠定了构造双空间存储器和实施内存推移理论的实践基础.所构造的实物系统包含一块TQ2440Core 2.0核心板、1 GB双空间存储器和由8个12位推移锁存器组成的推移锁存器组.将该核心板对其2 MB内存空间的随机访问自动落实为对1 GB双空间存储器字空间上指定位置的随机访问,并利用推移指令在双空间存储器的字空间上实现了窗框移动操作.  相似文献   

6.
研究了奇数阶幻方构造算法及其数据依赖性.通过对现有算法内存访问顺序和相关性进行分析,找出了限制现有算法并行性的主要因素,并通过改变内存访问模式和算法重构消除了数据依赖性.新的并行算法可以将原有算法的时间复杂度降为O(n),并且该算法可以达到成本最优.给出了该算法在不同存储系统下的实现方法.  相似文献   

7.
二维快速子空间DOA估计算法   总被引:3,自引:0,他引:3  
提出一种二维快速子空间DOA估计算法,该算法利用阵列协方差矩阵的一个子矩阵得到降维的信号子空间,不需估计整个阵列的协方差矩阵,也不需进行特征值分解,从而使得该方法具有运算量小、复杂度低和易于实时处理的特点,因而可以应用在小数据样本和快速时变的信号环境中.理论分析和计算机仿真结果表明:与MUSIC算法相比,该算法运算量最多为MUSIC算法的1/4,低信噪比条件下DOA估计性能损失并不大,当信噪比大于5dB时,性能与MUSIC算法相当.  相似文献   

8.
研究了一种在并行Turbo译码器中同时进行存储器访问的新颖的存储方案.该方案采用了图论中的节点着色法,与其他也在存储器中采用的非规则方法相比,所需的存储块(RAM)要多2~5块,但当码长变化时,这种配置方法更简单,可以在片上实时实现.实验表明,对于中高速的译码器(40~100 Mb/s),其硬件开销对3GPP标准中的交织器依然是可以承受的.  相似文献   

9.
为了满足LTE标准中Turbo译码器并行高速的译码要求,设计了一种支持并行译码、存储器访问无冲突的交织器结构.通过对交织器计算公式的推导简化,降低了交织器地址计算的复杂度,同时减少了地址计算单元,只需要一个块地址计算单元即可得到所有存储器的块地址值以及置换网络的控制值.该交织器结构能够实时计算交织地址值,同时灵活性非常高,能够支持多种并行度切换的Turbo译码器.设计的结构在SMIC0.13μm工艺下完成综合,面积为0.023mm2,等效门数为4.5k,最高时钟频率为315MHz.  相似文献   

10.
曹鹏  梅晨  刘波 《上海交通大学学报》2014,48(10):1389-1393
为了优化粗粒度可重构架构REMUS-II(Reconfigurable Multimedia System 2)的数据流通路,使其能够完成高性能媒体解码,针对媒体算法的数据访问特征,对REMUS-II的片上存储与片外存储访问模块进行优化.片上存储通过二维数据传输和转置等访问模式进行优化,片上数据传输效率分别平均提高了69.6%和15.1%.片外存储通过块缓存设计优化参考帧访问,平均减少37%的外存访问时间.经过层次化存储设计,REMUS-II数据流可满足计算需求,在200MHz主频下实现H.264算法和MPEG2算法高级档次的1 920像素×1 080像素高清分辨率实时解码.  相似文献   

11.
根据流媒体大数据的特点及其在检索定位、存储容量和速度上的局限性,提出了一种新型的视频流媒体大数据以帧为单位的存储架构;设计了与之相适应的硬件存储阵列系统架构和数据管理系统。重点研究了利用现有IDE硬盘设计形成存储视频流媒体大数据的控制器和硬盘存储阵列系统的结构。利用本文设计的存储阵列结构,一个具有n个硬盘的阵列,在实现n倍扩容的同时可以实现n倍提速;并且可以实现快速定位到帧。系统已经在Xilinx的XUPV5_LX110T开发平台通过验证。  相似文献   

12.
嵌入式系统中内部RAM存储空间普遍较小,无法直接将视频处理系统处理的大量数据存储到内部RAM上,而增强型直接内存存取(EDMA)可独立于CPU进行后台批量数据传输,并行用于嵌入式视频处理系统快速数据交换。以嵌入式平台TMS320DM6446 DSP为例,详细介绍了如何使用EDMA优化数据存取的策略。  相似文献   

13.
为了在自组网与有线网混合的互联(混合)网络中支持视频流媒体应用并保证服务质量,在传统的网关发现方案的基础上采用以流为单位进行路由的方法,并添加了根据当前网络状态与请求接入的视频流媒体质量要求关系的准入机制。另外,在将自组网参数化建模的基础上研究了自组网网络规模与整个网络容量的关系。仿真实验结果证明:该方案可以保证接入的视频流服务都能满足服务质量(QoS)要求,且实际容量可以达到网络最大容量的理论值。  相似文献   

14.
可重构视频编解码处理器ReMAP设计   总被引:1,自引:0,他引:1  
针对当前视频高清编解码的计算密集性、并行性和数据局部性的特点,提出一个粗粒度的可重构处理器ReMAP-2.该处理器由一个可重构的计算单元阵列构成,通过由临近直联和分段式总线组成的互联网络完成数据通信任务,具有良好的扩展性.计算阵列针对不同应用,通过加载不同配置信息流实时改变运算单元的计算功能和连接方式,支持多种格式的视...  相似文献   

15.
为提高无线信道上可伸缩视频码流的传输效率,提出了一种新的能量约束条件下可伸缩视频码流自适应传输算法。基于无线信道的Markov模型假设,在满足延时约束条件下,对各可伸缩视频编码帧的增强层数目以及信道发送速率进行联合优化,并给出了动态规划算法求解该约束优化问题。实验结果表明,相对于采用固定信道传输速率的可伸缩视频码流传输方案,该方案在达到相同平均视频质量时平均可节省44.95%~52.86%的能量,显著提高了无线信道上可伸缩视频传输的能量利用效率。  相似文献   

16.
为提高无线信道上可伸缩视频码流的传输效率,提出一种新的能量约束条件下可伸缩视频码流自适应传输算法。基于无线信道的Markov模型假设,在满足延时约束条件下,对各可伸缩视频编码帧的增强层数目以及信道发送速率进行联合优化,并给出了动态规划算法求解该约束优化问题。实验结果表明,相对于采用固定信道传输速率的可伸缩视频码流传输方案,该方案在达到相同平均视频质量时平均可节省44.95%~52.86%的能量,显著提高了无线信道上可伸缩视频传输的能量利用效率。  相似文献   

17.
杨宁  许嘉  **  吕品    李陶深     《广西科学》2019,26(4):398-404
为了解决现有的乱序数据流聚合查询处理技术不能在降低查询处理延迟,同时保障聚合查询结果的最终正确性的局限性问题,本研究设计了混合嵌入分布式流处理模块和分布式批处理模块的乱序数据流分布式聚合查询处理技术。该技术一方面基于用户给定的结果质量,限制自适应地优化流处理模块所用的缓冲区大小,从而尽可能降低流处理的查询处理延迟;另一方面基于备份于分布式数据存储系统的历史流数据,并以批处理的方式实现对极其晚到流元组的查询处理,从而保障聚合查询结果的最终正确性。基于真实的乱序数据流数据集对该技术进行测试分析表明:该技术在平均查询处理时延、查询结果精度和系统可扩展性方面,比目前最好的基于缓存的乱序数据流处理技术均具有显著优势。  相似文献   

18.
针对H.264视频编码标准中的去块滤波部分提出了一种基于时间的高效并行处理方法。为了降低对存储器的要求,同时提高中间数据的复用效率,采用了一种改进的滤波顺序,使得对外部存储器的读/写操作可以与滤波操作并行执行。另外,由于外部数据的预先载入技术,有效地降低了外部存储器的结构复杂度。与过往技术相比,这种单数据口外部存储结构的去块滤波器单宏块滤波处理周期总数减少了9·6%~74·4%,有效地提高了处理能力。  相似文献   

19.
常用门禁防区只有报警作用,当值班人员赶到,犯罪分子已经逃离现场,侦破难度大;常用视频监控系统只能定点监控录像,且占用大量硬盘内存.本系统把硬盘录像机作为中央控制器将两者有效结合.正常情况下,高速球型摄像机360。全方位监控不录像,布防时间段内当房门打开或有人在门前活动时,及时联动高速球型摄像机转动镜头对准房门录像并保存,既能全面监控,又能重点防范.硬盘录像机只对报警状态录像,大大节约硬盘存储空间.  相似文献   

20.
一种高效并行处理结构的H.264去块滤波器   总被引:1,自引:0,他引:1  
针对H.264视频编码标准中的去块滤波部分提出了一种基于时间的高效并行处理方法。为了降低对存储器的要求,同时提高中间数据的复用效率,采用了一种改进的滤波顺序,使得对外部存储器的读/写操作可以与滤波操作并行执行。另外,由于外部数据的预先载入技术,有效地降低了外部存储器的结构复杂度。与过往技术相比,这种单数据口外部存储结构的去块滤波器单宏块滤波处理周期总数减少了9.6%~74.4%,有效地提高了处理能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号