首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 186 毫秒
1.
基于CUDA的格子Boltzmann方法:算法设计与程序优化   总被引:3,自引:0,他引:3  
格子Boltzmann方法(LBM)由于其具有计算简单,天然并行,易于程序实现,易于处理复杂边界等优点而成为流体建模和模拟的一种重要方法.LBM的上述优点也使得其非常适合利用图形处理单元(graphic processing unit,GPU)进行大规模流体计算.基于GPU的CUDA(compute unified device architecture)编程平台,首先设计了相应的LBM算法,并以二维方腔流、二维圆柱绕流以及三维方腔流为例,着重探讨了存储器访问优化等优化技术的作用;此外,本文也对程序的性能进行了详细分析.结果表明,本文的算法取得了理想的加速效果,证实了GPU与LBM的良好匹配关系.  相似文献   

2.
单相流动数值模拟的SIMPLE算法在GPU上的实现   总被引:3,自引:0,他引:3  
王健  许明  葛蔚  李静海 《科学通报》2010,55(20):1979-1986
基于交错网格的SIMPLE算法, 利用CUDA(compute unified device architecture)技术进行了图形处理器(GPU)上的直接数值模拟(DNS). 将高雷诺数方腔流作为研究实例, 在NVIDIA GTX 295显卡的单个和4个GPU上的计算速度最高可分别达Intel Xeon 5430 CPU之单核的50和150倍, 与其他模拟结果的对比表明了上述计算的合理性, 并展示了采用GPU实现高精度大规模的湍流计算的前景.  相似文献   

3.
颗粒凝并动力学MonteCarlo方法的高效GPU并行计算   总被引:1,自引:0,他引:1  
Monte Carlo(MC)方法作为一种求解颗粒群平衡方程(PBE)的有效方法(PBMC),由于它对多维问题的适应性、符合实际颗粒动力学特征的离散和随机本质、程序结构相对简单、易于编程实现等优点受到人们持久、普遍的关注.但在涉及到颗粒凝并问题时,常规的PBMC方法计算代价较高,与模拟颗粒数目的平方成正比,限制了其工程应用.并行计算技术的快速发展,特别是近年来NVIDIA公司提出的计算统一设备架构(CUDA)为PBMC的快速高效模拟提供了一个良好的平台.本文在CUDA平台上实现了颗粒凝并动力学PBMC的图形处理器(GPU)并行计算(分别实现了累计概率法和接受-拒绝法选择凝并对)及中央处理器(CPU)的协同处理,与目前广泛运行于CPU的串行计算相比,取得了精确的计算结果和非常明显的加速,计算代价仅与颗粒数目成正比,在当前主流GPU/CPU设备上能够达到上百倍的加速比.  相似文献   

4.
格子Boltzmann方法(lattice Boltzmann method,LBM)是一种新型的流体力学模拟工具.基于介观动力学理论,LBM具有物理意义清晰、程序易于实施、边界易于处理和并行性能好等优势,因而在许多传统方法难以胜任的复杂流动领域得到了广泛应用.本文首先综述了LBM的诞生、发展以及现况,并阐述了LBM的理论和基本模型;随后,介绍了LBM在高强度聚焦超声(high-intensity focused ultrasound,HIFU)领域中的相关应用.基于LBM基本模型,构建了一种轴对称多弛豫时间(axisymmetric multiple-relaxation-time,AMRT)模型,并在模型中采用了具有二阶精度的Bouzidi-Firdaouss-Lallemand(BFL)边界处理格式.利用AMRT模拟了常见球面聚焦换能器产生的行波聚焦声场,并与传统声学方法进行了对比,验证了AMRT模型的有效性;随后又模拟了一种新型的球腔聚焦换能器产生的驻波聚焦声场,探讨了该类型换能器在HIFU治疗中的应用价值.本文结果旨在推动LBM成为一种全新的有效的声学仿真手段.  相似文献   

5.
在全球变化研究中,对省和国家尺度的土地利用变化过程进行模拟具有重要的意义.但大尺度的土地利用变化模拟存在数据量大、计算复杂、计算时间长等难点,由于计算能力和传统基于CPU计算模式的制约,在普通计算机中难以执行这样的模拟.把最新发展的GPU高性能计算技术与元胞自动机(CA)模型相结合,提出了GPU-CA大尺度土地利用变化模拟模型,并将其应用到省级尺度的土地利用变化模拟中.介绍了模型的问题映射、需解决的关键技术问题和计算的流程,并分析了GPU-CA模型在计算性能上的优势.通过全广东省的土地利用变化模拟,对GPU-CA模型进行了验证.实验表明,GPU-CA模型可以将原有一般CA模型的运行效率提高30倍以上,能够有效地应用于省和国家级的土地利用变化模拟,为全球变化模型提供重要的地表景观变化信息.  相似文献   

6.
由于性价比高、计算能力强,多核机群已经成为当今高性能计算的主流工具.然而,多核机群环境下不同的存储机制和通信延迟特点也为高效并行算法的设计带来了挑战.为充分利用多核机群的硬件资源获取最优性能,本文设计了一种有限元结构分析的层级负载均衡并行计算方法.该方法建立在对计算任务的层次性和粒度性充分挖掘的基础上.为与多核机群的硬件拓扑体系结构相适应,本文将计算任务划分为三个层次:节点间并行、片间并行和核间并行.其中,节点间并行和片间并行采用粗粒度并行计算方法,而核间并行采用细粒度并行计算方法.通过将计算任务映射到多核机群的不同硬件层面执行,该方法不仅有效实现了不同层面的负载均衡,而且大幅度降低了系统的通信开销.此外,它还大幅度减少了子区域的数目,有效提高了界面方程的数值收敛性.为验证算法的有效性,在"天河二号"超级计算机上进行了有限元结构线性静力分析大规模并行计算测试.结果表明:同传统区域分解法相比,层级负载均衡并行计算方法能够获得较高的加速比和并行效率.本文的研究主要集中在线性静力学问题上.对于非线性问题或者动力学问题,由于涉及多个迭代步,因此可以将本文算法封装为一个子函数进行调用.  相似文献   

7.
<正>近日,中国科学家研制成功面向人工通用智能的新型类脑计算芯片——"天机芯",并成功地在无人驾驶自行车上进行了实验。"天机芯"是一款新型人工智能芯片,把人工通用智能的两个主要研究方向,即基于计算机科学和基于神经科学这两种方法集成到一个平台,可以同时支持机器学习算法和现有类脑计算算法。搭载"天机芯"的自行车,可以实现实时视觉  相似文献   

8.
有限容积法与格子Boltzmann方法耦合模拟传热流动问题   总被引:3,自引:0,他引:3  
栾辉宝  徐辉  陈黎  陶文铨 《科学通报》2010,55(32):3128-3140
自然界和工程领域中的许多物理现象的发生通常涵盖几个数量级的几何空间及时间范围, 我们将其统称为多尺度物理现象. 在模拟多尺度问题时, 如果仅采用宏观方法, 则会存在一些不足, 如无法预知微小部分的细节以及引入复杂的经验关联式; 如果仅采用介观/微观方法, 则需要消耗大量的计算资源. 构造宏观-介观、宏观-微观、宏观-介观-微观等多种层次上方法的耦合体系, 可以在很大程度上克服这些不足. 构造了宏观有限容积法(FVM)与介观格子Boltzmann方法(LBM)的耦合模型(CFVLBM), 给出了由宏观物理量重构密度分布函数和温度分布函数的两个重构算子, 解决了LBM与宏观方法耦合的关键难题. 选取二维、三维典型传热流动问题对耦合模型进行了考核, 计算结果同基准解符合得很好. 最后将CFVLBM应用于计算多孔介质内的复杂流动问题. 研究表明, 基于文中重构算子的CFVLBM可以准确有效地应用于模拟传热流动问题.  相似文献   

9.
岩体开采变形对流体渗流性质的影响是煤瓦斯共采、油气资源开发、CO2地质封存及地下水资源保护等关注的重要问题.本文基于砂岩孔隙结构CT图像,发展了一种孔隙岩石CH4微细观渗流的LBM模拟方法及适合于大尺度孔隙模型的并行算法,运用此方法模拟分析了孔隙砂岩CH4微细观渗流性质及孔隙结构特征的影响,并与实验结果进行对比,验证了LBM方法的可靠性.利用LBM+FEM方法分析了应力作用下孔隙结构变形对CH4渗流的影响机制.结果表明:该方法可以直观定量地描述岩石微细观孔隙结构特征、渗流速度场空间分布、渗透率以及应力作用下孔隙结构变形对渗流速度场、有效孔隙度和渗透率的影响.不同孔隙度砂岩渗透率的LBM计算结果与实验值具有较好的一致性.  相似文献   

10.
马征宇  田永鸿 《科学通报》2023,(35):4764-4781
脑启发的脉冲神经网络被称为第三代人工神经网络,通过模拟神经动力学、事件驱动等计算特性捕捉时序信息和节能高效地进行计算,为人工智能领域的发展提供了新范式.大脑惊人的信息处理能力很大程度上归功于其庞大的网络规模和复杂的网络连接.构建大规模类脑神经网络为脑启发式的人工智能、神经形态计算以及多应用领域带来了突破性的进展.本文首先根据现有的研究,分类介绍了脉冲神经元模型、大规模脉冲神经网络模型与算法、深度训练框架和神经形态芯片等3个方面的计算原理和最新的研究进展,指出了目前大规模类脑神经网络研究的进展和存在的问题,随后重点论述了大规模类脑网络的神经形态视觉应用,包括神经形态视觉重构、极端场景目标检测等.最后,在总结已有研究成果的基础上,对该领域的研究现状给出了若干结论,同时指出了仍然存在的一些问题,并对未来研究的需求、期待与发展趋势进行了展望.  相似文献   

11.
吉春辉  刘战强 《科学通报》2011,56(23):1940-1946
高速面铣刀气动噪声由离散噪声与对总噪声影响较大的宽带噪声组成. 针对高速面铣刀流场和声场的非定常特点, 采用计算流体动力学(computational fluid dynamics, CFD)方法对面铣刀周围气流特性进行数值模拟, 分析铣刀容屑槽区域的速度分布. 计算线性欧拉方程(linear eulerequation, LEE)中的声源项确定铣刀表面声源位置及强度. 通过应用基于Lighthill 声学类比的Ffowcs Williams-Hawkings(FW-H)积分变换方程计算获得远场噪声. 针对铣刀表面不同声源产生的气动噪声频谱进行分析, 发现铣刀容屑槽及刀片前刀面是高速面铣刀气动噪声的主要声源. 等距及不等距铣刀噪声频谱分析表明不等齿距布置可改变频谱声能分布, 降低离散噪声的基频峰值,进而可降低铣刀气动总噪声.  相似文献   

12.
白学敏  廉自生 《科学之友》2009,(3):16-17,19
文章针对矿用电液主控阀存在的问题,运用PROE对其流道建立了模型,并通过CFD数值模拟软件Fluent对阀道内流场做了分析,在不同流道模型中对其流场进行模拟,得出了相应的压力分布云图、速度矢量图等。将结果进行对比,找出阀道内存在气穴、气蚀、冲击、振动的地方,为阀的优化设计提供依据。  相似文献   

13.
翟良君  郑雨军 《科学通报》2013,58(10):891-900
随着对于量子计算(机)的深入研究, 人们相继提出了不同量子计算的模型. 近年来, 基于分子振-转激发态的量子计算模型受到了研究者的广泛关注. 研究发现, 基于分子振动和转动模式的量子计算模型可以很方便地实现多量子比特计算, 并且可以获得足够长的退相干时间. 同时, 分子振转动量子计算的数值模拟也发现各种形式的量子逻辑门均可以获得很高的计算保真度. 分子振转动模式之间的纠缠是分子振转动量子计算的一个重要资源, 因此, 分子振转动纠缠动力学的研究也引起了人们的兴趣. 对于分子振转动量子纠缠动力学的研究能够为分子振转动量子计算的进一步研究和应用提供参考. 本文对分子振转动量子计算和分子振动纠缠的研究进展做了简要综述.  相似文献   

14.
张辉  杨夏 《自然杂志》2006,42(4):311-320
众所周知,量子计算机在处理某些特定问题时的速度将快于传统计算机。由于各国争相布局量子计算,它将成为世界科技发展的新高地。作为新一代信息技术,具有颠覆性质的“它”能够给人类带来多少魅力?近年来,国内外针对量子计算的研究风起云涌,如今的量子计算又发展到了什么阶段?文章作为引玉之砖,对量子计算从底层研究跨越到技术路线的发展以及未来的产业动向作初步的探讨。  相似文献   

15.
16.
丁泳程  郝敏佳  陈玺 《自然杂志》2019,41(5):335-342
经典计算机在处理大规模数据集或是高强度计算的时候,受硬件工艺与算法原理限制存在性能瓶颈。为了解决此类问题,人们构想出了用量子计算机通过量子力学的微观性质进行计算。近年来实验技术上的突破使得一些科技公司推出了面向公众的量子计算机,以更深刻地理解量子算法并解决一些实际问题。文章介绍了量子云计算的基本原理和发展现状,并给出了量子云计算应用的成功案例,希望以此引起人们对此领域的关注。  相似文献   

17.
郑新奇 《自然杂志》2012,34(3):143-149
地理计算模型和地理信息系统(GIS)的集成是实验地理学研究急需解决的技术难点。地理系统丰富的内容、复杂的结构和功能的多样性,给人们分析、模拟地理系统带来了挑战。本文针对众多地理计算模型侧重表达、地理分析,多方法应用、众多模型无法筛选等现状, 从计算地理学、地图学、地理信息科学等前沿需求出发, 将地理系统模拟的基本模型归纳为在GIS平台支持下由点[CD*2]多智能体(AB)、面[CD*2]元胞自动机(CA)、流[CD*2]系统动力学(SD)构成的地理系统模拟基本模型,并探讨了地理系统模拟基本模型的框架、结构与通讯,深入解析了各模型的原理、集成的关键技术与应用途径, 为地理系统模型进一步发展及地理系统模拟平台研制与开发提供参考。  相似文献   

18.
高性能计算技术发展   总被引:4,自引:0,他引:4       下载免费PDF全文
周兴铭 《自然杂志》2011,33(5):249-254
高性能计算(超级计算)技术是国家发展的战略性制高点技术。本文介绍了高性能计算技术的重要地位及当今世界各国装备应用情况;介绍了高性能机的发展历史与分类、最近十年的标志性成果及最近一年的世界最快计算机的前10名;分析了发展高性能计算技术的主要难点和研究方向;展望了未来十年发展的巨大新挑战。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号