共查询到18条相似文献,搜索用时 219 毫秒
1.
本文应用几何光学方法,一致性几何绕射理论和射线跟踪的方法对人定环境下的城市微约信道电流传播特性进行了预测。 相似文献
2.
3.
文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。 相似文献
4.
为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在独立线程以并行执行GPU计算任务;同时将批处理块划分成多个数据片,使用调度算法在前向传播和反向传播过程中以流水线形式进行处理.在数据集MNIST和CIFAR-10上的实验结果表明:优化后的系统在训练速度上有明显提升,同时准确率基本无损失. 相似文献
5.
以建筑物非规则排列城市小区电磁环境及电波传播特性为研究对象,应用射线追踪技术并以西安电子科技大学西南角为例数值研究非规则排列的城市小区中不同天线高度、建筑物的材料对可视区域电波传播路径损耗的影响,并预测该小区离地1.5 m处平面的电磁功率分布.研究结果表明:不同建筑物材料对电波传播路径损耗的影响大体一致,但电波传播路径损耗随天线高度的差异有所不同,离地1.5 m平面上各接收点电磁功率随离源点距离不同而不同. 相似文献
6.
7.
针对引导滤波算法运算速度慢、无法实时处理的问题, 提出基于统一计算设备架构(CUDA: Compute Unified Device Architecture)实现引导滤波算法的加速。利用CUDA 并行编程实现图像邻域窗口像素值求和,进而获得图像邻域均值; 通过利用寄存器和纹理存储器, 同时优化算法步骤, 获得引导滤波关键参数, 进而实现对算法的整体优化。实验结果表明, 与基于CPU 实现引导滤波算法相比, 基于CUDA 并行处理可在很大程度上提高运算速度, 基本达到了实时处理的要求。 相似文献
8.
城市隧道封闭狭长的结构使其内部的电波传播特性不同于室外,其内部的无线信号覆盖情况一直都被广泛关注.隧道内的无线通信系统可承载安全管理、调度指挥等业务,在行业信息化方面发挥重要作用.随着天线技术的不断成熟,分布式天线系统已逐步应用在城市隧道内.采用高性能射线跟踪技术开展分布式天线系统的无线信道仿真,得到分布式天线系统的部署方案,并对分布式天线系统和泄漏电缆系统的无线信号覆盖情况进行比较.结果表明在城市隧道内分布式天线系统的天线间隔采用400 m即可满足接收门限要求且可实现近似泄漏电缆的均匀覆盖效果,为城市隧道内分布式天线系统的部署提供了理论与技术支持. 相似文献
9.
三维地理环境下电磁波场强预测并行计算研究 总被引:3,自引:0,他引:3
在基于3DCM的电磁波空间专题信息的定量分析研究中,电磁波场强预测是基础性工作.目前射线跟踪模型是比较有效的定量预测模型.针对电磁波场强射线跟踪预测模型计算量大的瓶颈问题,研究了基于.NETRemoting的射线跟踪并行计算解决方案,实验证明该计算方案能缩短计算周期,从而使得电磁波场强预测射线跟踪方法走向实用. 相似文献
10.
文中运用一种基于镜像理论的射线跟踪方法来预测工作频率为 62 .4GHz的微蜂窝信道的传播特性。该方法考虑了反射和绕射。预测结果表明当假设建筑物的表面是光滑并且忽略了大气中氧分子的吸收损耗时 ,预测的接收信号功率要比实际信号功率小 ,而考虑建筑物表面的粗糙度和氧分子的吸收损耗将改善预测精度。最大反射阶数为两阶并且忽略绕射射线的贡献就可以很好地预测微蜂窝的传播情况。当直射路径被阻挡时接收信号的强度会下降一个比较大的值 ,这种特性会影响微蜂窝的覆盖。 相似文献
11.
提出了一种在CNGrid网格服务环境下解决期权定价问题的并行应用方法.这种方法基于BSDE(backward stochastic differential equation)模型.根据异构计算资源的特点,使用CUDA和MPI分别在GPU计算节点和CPU计算节点上实现并行算法,比较不同编程在异构计算节点上的实现效率.通过监控计算节点上计算任务的负载状况,利用CNGrid所提供的计算服务,灵活地在异构计算节点上完成期权定价计算任务. 相似文献
12.
讨论了储层随机模拟方法中的直接取样方法,并对其中地质模式分量的选取方式进行了改进,提出了结合空间相关关系模型结构化特性的方法.针对模式子空间中的求解问题,提出了基于统一计算设备构架(compute unified device architecture,CUDA)的并行策略.实验结果表明,模式分量选取方式的改进有效改善了两相河流沉积系统中河道的连续性,并且模式子空间中的求解的并行方法具有较小的时间复杂度.根据选取参数组的不同,并行方法的计算速度比串行方法最低提速10倍,最高提高了近100倍. 相似文献
13.
提出3种策略挖掘三维Kirchhoff积分法体偏移在众核GPU(图形处理器)上的并行性.首先,使用数据传输线程和GPU计算线程构造流水线并行框架,基于此框架直接实现异步输入输出(I/O)以减少GPU和网络存储之间数据传输所需的时间;其次,使用GPU的线程满载策略以使指令吞吐量最大化;最后,应用纹理缓存和常量缓存来减少片外存储器访问,并使用固定功能单元计算超越函数.实验结果表明:相比于IntelXeon E5430CPU上的算法串行版本,在nVidia Tesla C1060GPU上的优化算法实现了约20倍的加速比.比较了算法在3种不同GPU架构上的性能,并给出了CPU与GPU结果在0.5×10-4误差限下仅0.3×10-5的浮点数绝对误差. 相似文献
14.
运用大规模分子动力学并行开源代码NAMD测试了深腾7000GGPU集群的性能.在配备有Teslac1060与双路4核CPU的节点上,分别对烟草花病毒(STMV),血脂蛋白(ApoA1)与Tiny这3类分子进行了单节点与多节点的测试.测试结果表明:GPU相较于CPU能获得平均2至8倍性能提升,可为大规模分子的模拟提供高性价比的解决方案.然而,多节点下GPU的利用率却有所降低,其并行扩展性能也受到一定限制.另外,一些重要的分子结构构建的指标,如范德华力静止点的值也在一定程度上影响着模拟性能. 相似文献
15.
基于CUDA 和卡尔曼预测的实时电子稳像方法 总被引:1,自引:0,他引:1
针对传统电子稳像方法无法实现视频的实时处理的问题, 提出以SURF(Speed Up Robust Features)配准算法为基础, 基于CUDA(Compute Unified Device Architecture)编程实现算法的加速, 并利用卡尔曼预测器进行实时预测。算法利用CUDA 并行编程实现帧间特征点的提取和配准, 获得帧间运动矢量; 利用卡尔曼预测器获得稳定后的运动矢量, 实现对当前帧的运动矢量的补偿, 以达到实时稳像的目的。仿真实验结果表明, 该方法可有效去除视频帧间的抖动, 稳像效果良好, 实现了视频的实时处理。 相似文献
16.
面向CPU+GPU异构计算的SIFT 总被引:1,自引:0,他引:1
依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给出合理的调度算法.结果表明,在GeForce GTX 285上实现的尺度不变特征变换(SIFT)并行算法相比CPU上的串行算法速度提升了近30倍. 相似文献
17.
利用基于图形处理器(GPU)的计算统一设备架构(CUDA) Fortran编程平台,对直接模拟蒙特卡洛(DSMC)方法进行并行优化,并以高超声速气动热计算为例,考察了串行与并行计算速度以及不同仿真分子数对并行效率的影响.结果表明,在保证计算精度不变的情况下,程序取得了4~10倍的加速比,并且加速性能高低与计算规模大小成正比. 相似文献
18.
为了有效地发掘和利用异构系统在应用和体系结构上的并行性,以冷冻电镜三维重构为例展示如何利用应用程序潜在的并行性.通过分析重构计算所有的并行性,实现了将动态自适应的划分算法用于任务在异构系统上高效的分发.在曙光星云系统的部分节点系统(32节点)上评估并行化的程序性能.实验证明:多层次的并行化是CPU与GPU异构系统上开发并行性的有效模式;CPU-GPU混合程序在给定问题规模上相对单纯CPU程序获得2.4倍加速比. 相似文献