共查询到20条相似文献,搜索用时 31 毫秒
1.
根据单芯片多处理器的基本架构,围绕如何提高单芯片多处理器的性能,提出一种基于任务库的任务并行处理方法,给出了任务加载和调度策略,并用硬件予以实现.以4个基于51体系结构的MCU子处理器为单芯片多处理器架构,进行了任务分配调度实例验证.结果表明,提出的方法切实可行,能够提高单芯片多处理器的并行处理能力和工作效率. 相似文献
2.
Linux的网络转发性能研究 总被引:11,自引:0,他引:11
采用实验与性能"轮廓"相结合的方法,对千兆网络下对称多处理器Linux的NAPI模式转发性能进行研究,发现Linux的多处理器扩展性较差,其网络转发的性能瓶颈点是网络过滤模块,影响Linux性能和扩展性的主要原因是同步开销过大和处理器负载不均衡.为此,采用"中断亲和"的静态调度方法来均衡处理器负载,并降低调度引起的高速缓存命中失败率.改进了网络过滤模块,即减少了两个同步点,降低了同步开销.实验证明所提建议可提高Linux多处理器的性能和扩展性. 相似文献
3.
介绍了采用SOPC技术来设计一个共享资源的可穿戴计算机三处理器系统,主处理器主要负责操作系统和应用软件的运行,网络处理器主要负责进行报文处理,DSP处理器主要负责对视频图像数据进行处理.阐述了基于Nios II 和FPGA 的多处理器系统的实现机制,讨论利用硬件互斥核实现多处理器资源共享的方法,并给出硬件设计的具体步骤以及软件设计、调试方法和关键技术.介绍了网络处理器Nios II的结构特点和自定义指令以及基于Nios II软核处理器的网络处理器转发软件的设计方法和基于视频图像处理的DSP处理器的设计方法.经验证,采用此技术设计的三处理器系统很好地适应了可穿戴计算机微小型化和低功耗的设计要求. 相似文献
4.
上互连网络(Network orl Chip,NoC)采用包交换和路由的方法替代传统总线,没有全局的连线,具有很好的可扩展性,是未来多核处理器内核间的主要通信方式.NoC在片上系统中的应用有很多研究,片上系统在通信模式和网络负载分配等方面一般具有稳定性.在通用多核处理器中,由于受核间通信模式不确定性、系统的可重构性等诸多因素影响,NoC的研究和设计更具复杂性和挑战性.本文重点分析面向NoC通信的可重构路由算法. 相似文献
5.
单芯片多处理器(SCMP)系统是当前计算机体系结构研究的热点问题之一。与传统的多处理机系统一样,Cache一致性问题也是片内多处理器系统必须首先解决的问题。本文针对传统的多处理机系统在解决数据一致性问题上所普遍采用的写作废协议的实现方式上所存在的缺陷,提出了一种基于“双环结构”的片内Cache一致性解决方案,并对其实现后的性能进行了测试和评价。 相似文献
6.
基于CMP的多种并行蚁群算法及比较 总被引:1,自引:0,他引:1
基于片上多核处理器(Chip Multi-processor,CMP)的多种并行蚁群算法,包括并行最大最小蚂蚁系统、并行蚁群系统及两者的混合等5个并行算法,提出一种在CMP的每个处理器核心上模拟一个子蚁群,整体蚁群共享同一信息素矩阵,实现信息素隐式交流的方法.用多线程实时优先级实现该算法,并用若干旅行商问题实例进行了测试,分析了不同并行策略的影响.测试结果表明,基于CMP的并行蚁群具有相对于核心数目的线性加速比,异种蚁群混合策略在解的稳定性上更具优势。 相似文献
7.
VLSI技术进步和应用驱动使多核技术成为主流的微处理器设计技术。多核处理器作为一种时空域器件,应把超级计算机作为多核处理器的设计参考系,其主流架构将最终收敛到"小核、大阵列、层次化"上。文章利用Xilinx Virtex5-330TFPGA器件,设计实现了一款集成16个处理核的具备层次化架构特征的嵌入式多核处理器原型芯片,工作频率为90 MHz。多核处理器利用层次化的体系架构、灵活的片上互连、多种同步机制以及合理的并行程序模型,成功加载了实时视频淡入淡出(fade-in-fade-out)混叠应用(320×240,30帧/s)。基于该多核处理器架构,研究比较了粗粒度和细粒度2种并行编程模型。细粒度模型的多核同步操作稍复杂,但很好地掩盖了应用的串行操作时间,对视频淡入淡出混叠应用的加速比可达6.97。 相似文献
8.
针对共口径红外/毫米波复合制导应用需求,提出一种基于自回归(AR)谱估计和扩展卡尔曼滤波的信息融合处理新方法,基于此方法构建了实现红外/毫米波复合制导信息处理的多处理器片上系统(multiprocessor SoC,MPSoC),该系统采用主/从流水线结构,解决了基于此系统框架的多核通信、系统同步等问题.所提多处理器片上系统在单片FPGA上实现,FPGA实测结果表明,目标融合预测轨迹和真实轨迹基本重合,误差不超过10-2 rad,航向角融合精度远高于毫米波雷达和红外的精度,取得了比较好的融合效果;在100MHz的时钟下,整个红外/毫米波复合制导的信号处理的处理时间不超过2ms,满足复合制导对系统的实时性要求. 相似文献
9.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证. 相似文献
10.
针对现代多CPU的微机保护装置中不同处理器之间的信息交互采用外置存储器,系统正常运行容易受到现场复杂电磁环境干扰的问题,采用了片内存储器实现多处理器之间的交互.以片内存储器为主体构建多核芯片的多层次存储结构,并采用基于消息机制的共享信箱完成处理器之间的信息交互.利用排队论模型详尽地分析了共享信箱中数据FIFO的性能与需求,继而推导出适用于多任务系统中数据FIFO的深度经验公式. 相似文献
11.
12.
13.
实时多处理器容错算法是实时系统研究领域的一个重要课题.提出了一个动态处理非周期实时任务的容错算法.提出了对待实时任务的基、副版本采用不同的处理器分配策略.对于基版本,尽量提前任务的开始时间;对于副版本,尽量延迟任务的开始时间.通过实验模拟研究了算法的性能.实验表明,算法调度的成功率跟处理器个数、任务数以及任务计算时间有关.与采用单一处理器分配策略相比,具有较高的调度成功率. 相似文献
14.
三维众核片上处理器的研究近年来逐渐引起了学术界的广泛关注.三维集成电路技术可以支持将不同工艺的存储器层集成到一颗芯片上,三维众核片上处理器可以集成更大的片上缓存以及主存储器.研究三维众核片上处理器存储架构,探索了集成SRAM L2cache层,DRAM主存储器层等,对三维众核片上处理器性能的影响.从仿真结果可知,相比集成1层L2cache,集成2层L2cache的三维众核片上处理器性能最大提高了55%,平均提高34%.将DRAM主存储器集成到片上最大可以提高三维众核片上处理器80%的系统性能,平均改善34.2%. 相似文献
15.
多处理器系统上的最优任务分配的研究是有效利用系统资源处理实际问题的热点课题,文章在考虑任务可分和任务不可分的两种多处理器最优任务分配问题上,首次提出了这两个问题在处理器的个数大于1时都是NP-完全问题,其次给出了一个有效的近似算法, 相似文献
16.
在嵌入式双核处理器(ARM DSP)平台之上,提出基于嵌入式数据库的网络视频监控系统架构.通过移植嵌入式数据库FUEL在TMS320DM6446音视频开发平台,利用其在多线程环境下对共享数据的管理,实现了多核处理器平台的音视频编解码对数据访问的一致性;并基于FUEL实现了嵌入式视频监控系统,使得系统在嵌入式多核处理器架构上更好地管理多线程应用程序之间共享的数据,进而可靠、高效地进行音视频的网络传输. 相似文献
17.
多处理器系统上的并行选择算法 总被引:1,自引:0,他引:1
钟诚 《广西大学学报(自然科学版)》1993,18(1):14-18
对于共享存储的多处理器系统,给出一种易于实现的从任意给定的n个数据中既选取前m个最小者又选取前m个最大者的并行算法(m相似文献
18.
面向Cell宽带引擎架构的异构多核访存技术 总被引:3,自引:1,他引:3
针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批量访存计算中的片内访存开销,利用支持粗粒度访问的软件管理cache及数据预取来降低按需访存的片外访存开销;以访存接口库的方式来改善软件的可编程性.实验结果表明,所提技术的访存接口库在批量访存方式下的性能比ALF和CellSs提高了30%~50%,按需访存中软件管理cache性能比CBE软件开发工具包提高了20%~30%,4路数据预取访存比单路缓存的性能提高约50%. 相似文献
19.
《山东师范大学学报(自然科学版)》2017,(3)
随着计算机软硬件技术的不断发展,基于多处理器的并行计算机应用越来越广泛,本科生对多处理器的相关课程产生了浓厚的兴趣.本文以此作为出发点,从平台架构入手,介绍了基于龙芯的多路处理器实验教学平台,并分别以AES和DES算法为实验教学案例设计并行程序,将实验教学与民族芯有机结合. 相似文献
20.
一种多处理器并行优化处理模型的设计与研究 总被引:1,自引:0,他引:1
通过在多进程中引入信号灯机制 ,提出了基于多处理器硬件环境下并行优化处理模型 ,实现多个处理器的并发操作以及对临界资源的合理调度和使用 ,从整体上提高了系统的运行效率 .对并行优化模型的执行效率进行了分析 ,将该模型运用到高速光盘驱动器固件的设计中 ,获得了较好的应用效果 . 相似文献