首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
大点数FFT的多DSPs并行处理算法及实现   总被引:7,自引:0,他引:7  
在FFT变体的基础上 ,提出一种新的并行算法 :先将数据在几片DSPs上并行地进行前几级蝶型运算 ,然后将结果汇总到另一片DSPs进行后几级蝶型运算 ,以实现大点数的FFT。该算法便于流水处理 ,只有一次简单的数据通讯 ,而且旋转因子规律简单易于将大点数FFT拆分成小点数FFT。应用该算法在多DSPs系统上 (5片TI公司的高速DSP芯片 :1片C6 2 0 2和 4片C6 70 1)实现 2 5 6K点复数FFT只需用 4 9ms,说明该算法有并行度高和易于实现的特点。  相似文献   

2.
根据无陀螺惯性测量单元(GF-IMU)测量角速度的一般工作原理,提出了一种九加速度计的配置方案及其角速度解算方法,该算法利用加速度计输出的测量信息直接求得所测量的角速度的绝对值,没有积分运算引入的迭代误差,一定程度上提高了载体角速度的解算精度;为了避免角速度解算过程中的开方运算及符号误判,研究了一种解算角速度的代数算法,该算法降低了系统的计算量、提高了系统精度和实时性.  相似文献   

3.
高分辨力雷达导引头采用先进的合成孔径雷达(SAR)进行制导,通过对回波数据的大量积累和实时处理来提高雷达的方位分辨力。其中极为关键的部件就是FFT处理器,它的处理速度是整个数字信号处理系统中的重要指标。为了研制这种高速可编程FFT处理器和满足实时处理要求。本文采用两片TMS320C25芯片设计了一种可编程FFT处理器。当运算点数在128点以内(复数数据)时,通过合理地优化可执行程序代码和安排运算数据,其编程可以达到最高的效率,能够在0.5ms完成128复数点FFT运算(全部过程)。实践表明,效果良好。  相似文献   

4.
本文介绍了用TMS320C25微处理器和高速矢量处理器TMC2310所设计的超高速可编程FFT处理系统。设计中采用TMS320C25和TMC2310构成主从结构,充分发挥这两种高速处理器的特点,使系统具有灵活的可编程控制能力。采用TMS320C25作为主控CPU,TMC2310的外围存储器设计成乒乓结构,可以使系统实现连续的FFT处理。该系统可以在53μs内完成128复数点FFT运算,在514μs内完成1024复数点FFT运算。这一速度指标此单片TMS320C30快7倍、比单片TMS320C25快20倍。  相似文献   

5.
一种时域并行差分相关捕获算法   总被引:1,自引:0,他引:1  
提出了一种基于硬件实现、在时域对全球导航卫星系统信号进行相关捕获的新算法。算法采用并行差分结构,通过对相关结果的复用,实现了对多个卫星信号的同时捕获。还分析了该算法、传统的相关算法和现有的两种改进型时域相关算法以及基于FFT的频域相关算法的算法复杂度和所需寄存器数量。分析和仿真结果表明,该算法在计算单个复现码的1次相关时,运算量并不随着过采样率的增加而增加。相比于传统的相关算法和现有的两种改进型时域相关算法以及基于FFT的频域相关算法,该算法在运算复杂度上具有优势,有利于在实际硬件系统中实现。  相似文献   

6.
针对定点FFT/IFFT处理器精度不高的缺点,提出了自定制浮点FFT/IFFT处理器的FPGA硬件实现。结合工程需求和FPGA器件结构确定了自定制浮点数据格式,阐述了实现浮点运算和提高蝶形运算速度等关键技术,并用FPGA实现了一个可变数据长度的FFT/IFFT处理器。该处理器已投入实用,工作性能稳定,系统时钟80MHz,完成1024点FFT/IFFT运算只需64μs,处理误差小于-80dB,功耗小于1W。  相似文献   

7.
TMS320C25是美国TI公司TMS320系列的第二代产品,其运算速度可达1000MOPS,并且具有单指令周期的乘法/累加指令和专门为FFT运算而设计的位反向寻址指令,因此,它在现代数字信号处理中占有重要的地位。 快速付立叶变换(FFT)是现代信号处理中的一个重要方法。尤其在雷达信号的处理中,这种方法显得越来越重要。但是,长期以来,由于处理器速度的限制,使得这种方法很难用于实时信号处理系统。然而,用TMS320C25汇编语言编程可使128复数点FFT在1.23ms内完成。 本文根据TMS320C25芯片的硬件结构(哈佛结构)特点,充分利用芯片内的RAM,在限制可执行代码为1984字的情况下,对FFT运算的蝶形进行优化,提出了一种快速计算FFT的编程方法,给出了这种方法在TMS320C25上实现的过程和框图。  相似文献   

8.
针对合成孔径雷达(synthetic aperture radar, SAR)原始数据频域压缩运算中基于快速傅里叶变换的分块自适应量化(fast Fourier transform based block adaptive quantization, FFT BAQ)算法实现复杂的问题,分析了SAR原始数据二维傅里叶变换后数据的能量分布情况。从香农率失真理论出发,利用信源微分熵确定最优的量化比特分配,提出了一种改进的FFT BAQ算法。分析了改进算法的复杂度,并与传统的FFT BAQ算法和BAQ算法做了相应的比较实验。实验表明,改进算法在保证原压缩性能的基础上降低了FFT BAQ算法的复杂度和对硬件的要求。  相似文献   

9.
本文给出了一个超视距雷达频域数字波束形成方案。用这种频域方法可以大量减少DBF所需的存贮量和计算量。误差校准方便。由于在FFT处理器输出端保持了天线阵元上所有的信息,可以获得灵活的方向图。  相似文献   

10.
求解带装载能力限制的开放式车辆路径问题的遗传算法   总被引:6,自引:0,他引:6  
符卓  聂靖 《系统工程》2008,26(2):78-83
对带装载能力限制的开放式车辆路径问题的求解进行了研究,提出了一种用于求解该问题的遗传算法.对算法中几个关键操作的不同实现方式的性能进行了比较.给出了算法对标准测试算例的运算结果,并与文献中目前最好的结果进行了比较和分析.  相似文献   

11.
对SAR并行成像处理进行了深入研究 ,在串行成像算法的基础上 ,提出了SAR并行成像处理的一种中粒度并行算法和一种混合FFT算法。中粒度并行算法针对SAR信号处理大数据量的特点 ,在系统内存有限的情况下 ,对任务划分进行优化 ,以提高系统处理性能。混合FFT算法将Cooley -TukeyFFT算法和WinogradFFT算法结合起来 ,使得FFT算法在通用平台上更高效地运行。在国产曙光系列并行机上的实验结果证明 :我们的研究工作是有成效的。  相似文献   

12.
信号到达角的快速估计算法研究   总被引:3,自引:0,他引:3  
针对将FFT算法用于空域信号处理中存在受空间阵元数的限制,分辨率不高,无法识别相距较近的两个目标的问题,对等距线阵的DoA估计算法进行了研究,提出了基于空间分割的快速MUSIC算法。此算法在FFT算法粗略估计的若干局域子空间内进行谱峰搜索,可大大减小MUSIC算法全空间谱峰搜索的计算量。在单一期望信号的情况下,提出了基于最小二范数的快速DoA估计算法,它可进一步减小计算量。仿真结果证明了对DoA估计的快速算法理论分析的正确性和算法的有效性。  相似文献   

13.
光流场计算是计算机视觉及视频图像压缩中的重要领域,它的实时实现又是该领域的一个重要研究课题。考虑到硬件实现的实时性,综合分析了现有的各种光流算法,重点对基于区域相关匹配的光流估计算法的运算进行改进;同时研究了改进算法的体系结构,并进行了设计实现。设计中总体采用了并行流水线结构方式,在某些流水线段上采用了SIMD结构,提高了系统处理速度。验证结果表明,系统处理时钟的速度可以达到80 MHz。对于256×256的图像序列,如果系统实际工作时钟频率为50 MHz,每处理一帧仅需要16 ms。  相似文献   

14.
基于分布式并行计算的神经网络算法   总被引:1,自引:0,他引:1  
为了提高计算性能(速度与可扩展性),提出了一种新颖的神经网络的并行计算体系结构和计算网络权函数的训练算法。权函数是广义Chebyshev多项式和线性函数的复合函数,只需要通过代数计算就可以求得,不需要梯度下降计算或者矩阵计算。各个权函数能够独立求解,可以通过并行系统采用并行算法计算。算法可以求得全局最优点,得到反映网络误差的一个有用的表达式。此外,算法在不超过权函数总数的范围内,还具有维持加速比与并行系统中提供的处理器的数量成线性增长的能力。仿真实验结果表明,本文算法的计算性能远远优于传统算法。  相似文献   

15.
基于基2-FFT的伪码快速捕获实现新算法   总被引:6,自引:0,他引:6  
讨论了基于基2-FFT的伪码快速捕获方法,论述了其中常见的数据内插处理算法并提出Sinc数据内插新方法。Sinc数据内插算法采用Sinc内插滤波器来实现数据的精确内插,以满足基2-FFT的数据点数需要。仿真表明,采用Sinc数据内插方法实现的基2-FFT伪码快速捕获系统,其捕获性能优于传统的补零法和线性内插法。Sinc内插算法更适合在低信噪比下工作和对捕获时间有严格要求的系统。  相似文献   

16.
基于多电视台的两种无源雷达成像算法   总被引:1,自引:0,他引:1  
基于外辐射源的无源雷达成像是当前新体制雷达的研究热点,给出了利用多个电视台作为外辐射源的直接二维快速傅里叶变换成像算法和极坐标成像算法。建立了多基地无源雷达成像模型,通过理论推导得到目标散射函数和雷达接收信号之间的傅里叶变换对的关系。选取15个电视台信号作为外辐射源进行了仿真实验,分析和比较了两种算法的性能,证实了算法的可行性。  相似文献   

17.
实时仿真算法的研究进展   总被引:9,自引:2,他引:7  
从六个方面综述动力学系统实时仿真算法的一些最近的研究进展。讨论包括:快速实时仿真算法研究,实时组合算法与网络计算机上的实时并行算法;微分代数系统的实时算法与实时并行算法;实时间断处理;仿真模型信息传输误差估计;动力学系统仿真假解研究等一些新的思想和方法。  相似文献   

18.
针对大规模多阶段任务系统(phased-mission system, PMS)的可靠性求解,引入并行计算思想,通过分析传统的一致化方法(uniformization method, UM),基于Nvidia提出的CUDA(compute unified device architecture)架构,实现了基于图形处理器(graphics processing unit, GPU)的UM并行算法(GPU-UM),并采用合并访问和共享内存技术,提高了GPU中数据负载的利用率;PMS中不同阶段参与任务的设备及其数量通常会发生变化,导致阶段间依赖性处理困难。通过对新设备加入、已有设备暂时退出任务或完全退出任务等3种基本情况的分析,提出了阶段间状态映射机制,实际中的阶段变化情况更加复杂,可综合上述3种基本情况进行处理。通过算例对比了GPU-UM、CUDA-UM、传统UM和Krylov子空间等4种算法的计算时间和可靠性结果,分析表明GPU-UM算法的计算耗时优于其他方法,且结果精度也能满足可靠性计算需求;同时,通过对比分析UM算法和Krylov子空间算法与仿真方法的结果误差,表明提出的阶段间映射机制能够正确处理PMS中阶段间的复杂依赖关系。  相似文献   

19.
1 .INTRODUCTIONIn the recent decades ,the fractals[1]has found manyi mportant applicationsinthe field of biology,geogra-phy, physics , graphics and so on. It has excellentperformance in describing the actual living phe-nomenon that is unstable ,irregular ,and complexity,such as ti mes series of chaotic signs . The calculationof correlation di mensionis a key probleminfractal di-mension[2 ,3]. The standard solution of correlation di-mension calculation requiresO( N2)ti me , whereNis numbe…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号