首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对CPU进行图像处理已经无法满足系统实时性需求这一情况,提出了一种基于HLS和PYNQ的图像处理硬件加速器设计。该设计利用了FPGA具有数据并行处理的优势,克服了FPGA不易开发、移植性较差的缺陷。首先选择图像缩放处理算法作为实验的测试对象;然后在ZYNQ平台上根据软硬件协同的特点分配不同的系统任务,通过HLS开发工具使用C++实现和优化图像处理算法,并转化成RTL文件,再打包成IP核输出;在Vivado2018.3上搭建硬件实验平台,通过Jupyter Lab对实验进行验证和分析。结果表明,缩放算法的处理速度由CPU端的1 110 ms缩减为FPGA端的213 ms,执行速度提升了5倍。  相似文献   

2.
为了提高嵌入式系统设计中电容层析成像(ECT)的图像重构速度,研究了一种针对进阶精简指令集机器加上现场可编程门阵列(ARM+FPGA)硬件架构的图像重构算法加速技术。针对广泛应用且鲁棒的Landweber迭代算法(ILA),首先分析算法结构,然后基于FPGA的流水线特点,改进ILA涉及的循环结构,从而达到加速的效果。同时,针对ARM+FPGA架构的特点,讨论了ARM核与FPGA核各自的任务分配方式,进一步优化了算法速度。为了验证算法的有效性,分别在使用MATLAB编程和使用提出的加速方法搭建的ZYNQ平台进行了图像重构实验,从图像重构耗时、图像相对误差和图像相关系数3个指标论证提出方法的有效性。实验结果显示,使用搭建的ZYNQ平台进行Landweber算法成像时,每个图像的运行时间比使用MATLAB编程的运行时间减少了30%~40%。该研究在保持重构精度的同时有效提升了迭代算法的速度,对于ECT系统的硬件加速具有一定适用性。  相似文献   

3.
基于FPGA的快速浮点除法器IP核的实现   总被引:1,自引:0,他引:1  
利用Altera的Quartus II软件开发平台在FPGA上实现了快速浮点除法器IP核的设计.该IP核的算法采用存储运算过程中的一些乘积项,有效地减少了除法运算过程中的移位操作,提高了浮点除法的运算速度及算法的效率.同时,基于FPGA的浮点除法器IP核具有很好的可移植性和复用性,适合应用到各种嵌入式和通用处理器中,从而提高复杂数字系统的设计效率,具有广泛的推广应用价值.  相似文献   

4.
 针对大型周界安防预警系统,提出了一种分布式光纤振动传感信号采集系统设计,主要基于ARM+FPGA的嵌入式平台实现。根据分布式光纤振动传感信号的特点,数据采集系统以FPGA为主控制器,实现了脉冲波和连续波的双通道并行信号采集。FPGA接收ARM传送控制命令,采集硬件信号控制采样芯片AD9430和AD9203转换的数字信号,并将采集到的数据暂存于利用FPGA的IP核生成的FIFO缓存中,等待传送给ARM处理器。ARM处理器主要负责提供前端FPGA采集的各种参数并接收FPGA发送过来的数据。该数据采集系统中,ARM处理器和现场可编程门阵列FPGA的互联接口的设计是关键,主要是在内核层设计FPGA设备驱动,利用ARM的外部总线接口完成数据的传输。将数据采集系统应用于光纤监控预警安防系统,可以检测到脉冲波和连续波信号,提高系统实时性,为分布式光纤安防预警系统的研究提供了基础。  相似文献   

5.
为实现视频监控系统的网络化和智能化,以ARM为硬件平台结合机器视觉库OpenCV设计一种嵌入式实时人脸检测系统。该系统由嵌入式平台采集USB摄像头数据,通过网络将图像传输至PC主机,从而实现实时监控;系统以QT构建交互界面,采用OpenCV人脸Haar特征进行人脸区域检测,Eigenfaces算法进行人脸识别。结果显示:该系统运行稳,成本低,可以实现网络实时人脸检测与识别,识别率高。  相似文献   

6.
介绍了一种基于USB2.0协议,选用Wishbone总线接口的主机端控制器IP核的设计与实现.该设计以EHCI作为软硬件接口划分,支持高速(480 Mb/s)的数据传输,实现了DMA的自主控制、事务的动态调度以及数据跨时钟域的合理开销,达到减少SoC平台处理器的I/O负荷、提高传输效率与系统性能的设计目标;USBIP核的设计与系统软件开发同步进行,有效地验证了硬件功能,最终经FPGA平台与ASIC实现测试达到协议标准,可作为一个通用IP核系统集成.  相似文献   

7.
针对现有智能监控系统难以同时满足清晰、准确、实时、可靠等要求的缺点,提出了一种基于嵌入式视频监控的实时人脸捕捉系统。在ARM Linux操作平台上建立流媒体服务器,实现CCD摄像头的视频采集和传输,采用背景差分法与相邻帧差相结合的方法来实现运动目标的分割与精确定位,提出了一种基于肤色模型的人脸区域分割算法,缩小了运动区域的人脸检测范围,在此区域内,通过Adaboost算法实现了运动目标的实时人脸捕捉。采用ARM1176JZF-S内核的Samsung S3C6410处理器,以Linux2.6.28作为系统的软件开发平台,在基于开源计算机视觉库OpenCV软件工具基础上进行系统开发与测试。结果表明,该系统实现了运动目标的检测以及人脸捕捉,并具有很好的清晰度,从其统计的检测率和运行时间看,有很好的鲁棒性和实时性。  相似文献   

8.
传统元胞自动机数学模型在计算机软件中的实现,受当前处理器顺序执行指令的特性和元胞自动机特殊的数据结构所限,无法同时实现高速度和高精度,因此将其移植到FPGA上实现.硬件实现的模型具有并行计算的特性,能够显著提高计算速度,芯片规模的快速扩大又为高精度的实现提供了可能.设计元胞自动机硬件模型,将其作为IP核嵌入SOPC系统中,在上位机控制下进行模型演化,并设计了软件模型进行参照.经测试,硬件模型能正确实现元胞机算法,在一个时钟周期内完成一代元胞演化,相比于软件模型显著提高了执行效率.  相似文献   

9.
文章提出了一种基于TI系列DM6446的快速人脸识别系统设计方案,采用AdaBoost人脸检测方法以及改进的线性辨别分析(LDA)特征空间的人脸识别算法,实现实时的人脸检测与识别,考虑到DM6446双核处理器的特点,给出了ARM端和DSP端双核的协同工作方法,以提高算法效率;分析测试结果表明,系统运行可靠,能够实现实时、准确的人脸识别。  相似文献   

10.
针对现有门禁系统中存在的技术缺陷、维护成本高等问题,本文设计了一套基于ARM+Linux的人脸识别门禁系统。该系统采用S3C2410芯片为处理器、IP网络摄像头作为视频采集设备;采用PCA算法进行人脸图像识别,并以识别输出来控制电控锁模块,从而实现人脸识别门禁系统的智能控制。最后,在不同的环境下进行了人脸识别测试,测试结果表明,该系统能准确快速高效地识别人脸,平均识别率高达99%。  相似文献   

11.
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题, 以YOLO目标检测模型为例, 设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型, 在FPGA实现神经网络前向推理加速, 在ARM中实现加速器调度。实验结果表明, 部署至Xilinx ZCU102开发板上, 该模块在200 MHz工作频率下, 平均计算性能达到425.8 GOP/s, 推理压缩模型速度达到30.3 fps, 模块功耗为3.56 W, 证明该加速模块具备可配置性。  相似文献   

12.
基于Adaboost人脸检测原理,结合Windows下的Visual C++编程,设计了人脸检测系统.通过MIT人脸库和自建人脸库结合的方法,且对该人脸库进行有效的训练,实现人脸检测功能,提高了检测率和检测速度.利用连续自适应均值移动算法(Continuously Adaptive Mean Shift,Camshift)对人脸进行跟踪,并对Camshift算法进行改进,利用Adaboost人脸检测初始化模板的方法,将检测与跟踪结合起来,有效提高了人脸跟踪效率.  相似文献   

13.
描述了基于S3C2410的人脸检测系统的平台设计及实现过程,主要包括人脸检测系统的硬件架构搭建及软件平台设计实现.将Adaboost人脸检测算法在该硬件环境上的运行,得到了较好的效果.该系统为嵌入式系统的开发提供了一个范例,达到了系统体积小,成本低,速度快、可靠性高的目的.  相似文献   

14.
针对自动视频监控系统中计算密集度高的特点,提出了基于片上可编程系统(PSoC)软硬件协同设计的实时视频监控系统.首先,利用可编程门阵列(FPGA)设计了前景对象检测算法的时间关键步骤;然后,通过在嵌入式Nios-II处理器上执行高级语言编程实现其他非时间关键任务;最后,使用流协议将定制和并行处理组件集成到视频处理链.文中提出的方案软硬件协同设计,有效利用了FPGA资源,并在DE2-70板上实现.实验结果表明,文中设计的视频监控系统的实时处理能力明显优于其他几种现存的系统.?更多还原  相似文献   

15.
针对自动视频监控系统中计算密集度高的特点,提出了基于片上可编程系统(PSoC)软硬件协同设计的实时视频监控系统.首先,利用可编程门阵列(FPGA)设计了前景对象检测算法的时间关键步骤;然后,通过在嵌入式Nios-II处理器上执行高级语言编程实现其他非时间关键任务;最后,使用流协议将定制和并行处理组件集成到视频处理链.文中提出的方案软硬件协同设计,有效利用了FPGA资源,并在DE2-70板上实现.实验结果表明,文中设计的视频监控系统的实时处理能力明显优于其他几种现存的系统.  相似文献   

16.
提出了一种新的基于FPGA的立体图像差异性算法,它以块匹配算法为基础,根据FPGA的特点,对图像相关性的公式进行设计优化,并结合穷尽方式搜索和预测方式搜索,提高算法的执行速度.设计基于FPGA的立体图像差异性算法IP核,充分利用FPGA独特的并行处理机制和强大的运算能力以提高系统的处理速度和性能.系统测试结果表明,基于FPGA的立体图像差异性算法,可以达到每秒33帧的处理能力,处理速度能够达到PC机的二百倍以上,具有较好的实时性;且能够连续处理500帧图像数据,具有较好的稳定性.  相似文献   

17.
提出了一种应用于安全驾驶辅助的鲁棒的车道偏移实时警告系统.采用ALTERA公司片上NIOS II系统的CycloneⅡ FPGA作为处理核心,应用了一种鲁棒的快速车道线偏移警告算法,利用Avalon总线进行IP核的定制,实现了车道偏移警告系统的软硬件设计.测试结果表明,系统的准确率和实时性能满足全天候车道偏移警告需求.  相似文献   

18.
介绍了一种基于FPGA的实时多通道DMA系统的设计,该系统的核心是基于FPGA的DMA控制器IP核.分析了整个系统的工作原理和实现方法,并给出了该IP核的Linux驱动实现方法及实现后的测试性能结果.  相似文献   

19.
基于硬件描述语言(HDL)或者逻辑图的设计方法难度较大,周期较长,利用Xilinx的高层次AccelDSP设计工具,按照约定的编程规则,可以将MATLABM语言编写的算法快速转变为FPGA实现.简要回顾了图像边缘检测的基本原理,给出了Sobel算子边缘检测算法的实现流程,核心代码和硬件时序仿真的结果.设计过程表明,基于AccelDSP工具的设计方法较好地降低了设计难度,提高了效率.  相似文献   

20.
针对LCD中汉字字库可配置性比较差,对中文的支持性不统一的问题,本文提出了基于FPGA的一种可配置汉字字库的实现算法。该算法设计了一种点阵字库的公式,该公式能够通过自己的编码来重新组合任意自己需要的字库。并且在FPGA开发平台采用VHDL语言设计了实现了IP核。经实验表明该算法实现的汉字字库可配置性强,降低了LCD的成本价格,由于采用了VHDL实现,提高了并行计算的能力,因此降低了时间复杂性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号