首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 211 毫秒
1.
提出一种基于图形处理器(GPU)的对称正定稀疏矩阵复线性方程组迭代算法. 首先, 采用基于GPU的共轭梯度法和双共轭梯度法, 实现GPU上的矩阵向量乘操作, 并充分优化相应的算法步骤; 其次, 实现基于GPU的对角元预处理、 不完全Cholesky分解和对称超松弛3种预处理方法, 提出一种基于GPU的求解三角方程组并行算法; 最后, 实验分析各种预处理方法的优劣. 实验结果表明, 该算法较CPU串行迭代算法与经典的直接法速度提升较大, 最高可达到76倍的加速比.  相似文献   

2.
基于EBE策略,讨论求解大型线性方程组CG方法及PCG方法的并行计算.在不显式形成总刚度阵的情况下利用单元级矩阵的Cholesky分解构造总刚度阵的近似,形成预条件矩阵,提出了求解大型线性方程组的EBE—PCG并行算法,并讨论了算法在网络机群(COW)并行计算环境下的实现.结合实际算例,对EBE-PCG并行算法进行了并行效率分析.结果表明基于单元级Cholesky分解的EBE—PCG算法具有很好的并行效率,是一种适合网络机群并行环境的高效并行算法.  相似文献   

3.
对于一阶常微分方程组,将具有导数变量的系数矩阵作三角化分解,使其简化成单位矩阵.应用具有三阶精度、单步自起步、无条件稳定的隐式算法对一阶常微分方程组进行了简化,改进了Calahan算法.其中逆矩阵与矩阵的乘积,是通过矩阵三角化回代求解计算,从而回避了矩阵求逆.该算法保留了原方程组系数矩阵的稀疏存储方式和稀疏矩阵的运算规则,减少了计算时间和运算过程所需要的存储空间.  相似文献   

4.
为加快大型、复杂柔性多体系统的动力学仿真的速度,对多体系统动力学的并行算法进行研究。首先分析了微分代数方程(differential algebraic equations,DAEs)在数值计算求解过程中主要的计算量。据此,提出采用OpenMP并行计算系统的刚度矩阵、右端项和采用并行的稀疏线性方程组求解器Pardiso对线性方程组进行求解的并行策略。将这两种并行策略应用到自主开发的柔性多体系统动力学软件THUSolver中,实现了对多体系统动力学的并行计算。通过两个工程算例的仿真得到并行的加速比和计算效率,结果表明:采用的两种并行策略都有很高的计算效率,能大幅提高多体系统动力学仿真的速度。  相似文献   

5.
本文以取Gauss消去法的回代过程即三角方程组的并行化为研究对象,重点研究了用基于奇偶二分法的并行算法来求解三角方程组。给出了二分法的矩阵表示形式,并举实例验证了该算法的高效性。  相似文献   

6.
基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式.针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩阵,求解其对应方程组会遇到很多困难等问题,采用不完全LU分解(即上三角与下三角分解)处理的稳定双共轭梯度算法(BICGSTAB算法)求解该线性方程组,通过对层状介质和二维模型电磁响应进行计算,获得二维大地电磁的视电阻率曲线和阻抗相位曲线.研究结果表明,BICGSTAB算法具有速度快、精度高和稳定性好等优点.  相似文献   

7.
本文对n阶非奇异实稠密矩阵A的WZ分解提出了一种新的并行算法。用n~2台处理机,我们可以在3n-2步内求得矩阵A的WZ分解。该算法与文献[1]中的方法相结合,可得并行求解线性方程组的另一种有效算法。文中所提及的算法均适用于SIMD型并行计算机。  相似文献   

8.
本文给出了适合于系数矩阵为嵌套的BDD的大型稀疏方程组的LU并行分解的求解算法,它可以提高运算速度,减少运算量,从而使迭代法在大规模电路模拟计算中得到充分利用,通过具体电路实例说明了这种方法的实用性  相似文献   

9.
随着GPU在高性能计算领域更多地用于科学计算,采用GPU技术对大型稀疏线性方程组进行计算,从而满足人们对计算速度和计算精度要求的提高。NVIDIA Fermi架构的开发,大大提升了GPU的双精度浮点运算能力。拟极小残差法(QMR)作为高性能计算领域中的重要迭代算法,基于求解稀疏代数方程组对ELL算法进行GPU优化。通过对不同规模线性方程组计算分析表明,QMR-GPU的性能提升为原始QMR的3.5倍,与传统的BICG法相比,QMR并行算法具有速度和存储优势,可获得良好的并行加速比。  相似文献   

10.
在求解弹性波动方程中,有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足,制约其优势的发挥.根据有限元法的"化整为零、集零为整"的基本思想与并行处理技术的"分而治之"的原则基本一致,采用基于多CPU的并行算法,从有限元参数矩阵计算和线性方程组求解两个方面入手,把求解区域分到多个CPU上并行计算参数矩阵,对线性方程组采用循环块三对角线方程组进行并行求解.对比了不同大小空间和不同CPU个数下的加速比,证实了多CPU的并行算法能够克服基于单CPU串行算法的物理限制,满足了有限元法的巨大空间量和运算量的需求.此算法具有理论上的正确性和实践上的可行性.  相似文献   

11.
在求解弹性波动方程中,有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足,制约其优势的发挥。根据有限元法的“化整为零、集零为整”的基本思想与并行处理技术的“分而治之”的原则基本一致,采用基于多CPU的并行算法,从有限元参数矩阵计算和线性方程组求解两个方面人手,把求解区域分到多个CPU上并行计算参数矩阵,对线性方程组采用循环块三对角线方程组进行并行求解。对比了不同大小空间和不同CPU个数下的加速比,证实了多CPU的并行算法能够克服基于单CPU串行算法的物理限制,满足了有限元法的巨大空间量和运算量的需求。此算法具有理论上的正确性和实践上的可行性。  相似文献   

12.
基于对稠密线性方程组系数矩阵的一种新的分解方法,给出了分解与求解过程的并行算法,并分析了利用P台处理机并行运算时的加速比  相似文献   

13.
求解线性方程组问题本是一个非常古老的数学问题,已进行了大量的研究.但随着科学技术的发展.求解问题的系数矩阵的规模变得越来越大,求解大规模稀疏矩阵的线性方程组问题已经成为科学计算中的最重要的问题之一.求解大型线性稀疏方程组的中心线法于1986年提出,文献[7]对其进行了部分改进,本文通过改进文献[7]中偏离中心线的偏离度,重新定义中心线向量,提出了一种与初始向量的选取无关的大范围收敛的迭代算法.与文献[7]的算法比较,本文提出的算法具有大范围收敛、计算量小、精度高的优点.  相似文献   

14.
本文讨论在用ABS算法求得某线性方程组的解之后,如何有效地利用求解过程中所得到的信息,求解增加若干个变量或减少若干个变量所得到的新的方程组。本文的算法是基于ABS算法而提出的,它们适用于反复求解不断增加变量和减少变量的问题。计算量分析表明,与完全重新求解新方程组比较,本文所提出的方法可以较多地节省计算量。  相似文献   

15.
基于对稠密线性方程组系数矩阵的一种新的分解方法,给出了分解与求解过程的并行算法,并分析了利用P台处理机并行运算时的加速比。  相似文献   

16.
本文就电子电路机助分析与设计中的稀疏矩阵技术进行了分析和讨论。文中首先论述了求解线性方程组在电路机助分析与设计中的重要性,以及稀疏矩阵技术的主要问题,接着结合电路方程组的特点,就稀疏矩阵的排序、存贮和编程技术进行了比较和论述。最后介绍了稀疏矩阵分块技术以及平行算法等问题,附录中介绍一种求解不对称高稀疏线性代数方程组的有效算法。  相似文献   

17.
对带形对称系统提出了新的并行算法,在划分基础上充分利用矩阵的稀疏性,使算法具有高的分解效率及并行加速比。  相似文献   

18.
提出一种不完全分解预处理方法,并结合迭代法计算矢量有限元方程组。预处理方法采用基于拓展乔里斯基分解的多波前法对有限元方程组的系数矩阵进行分解和更新,并采用基本线性代数系统库函数计算稠密矩阵乘来保证算法内层循环的高效率。该预处理算法在对系数矩阵进行数值分解前引入缩放矩阵以改善矩阵条件数。针对有限元方程组系数矩阵稀疏或部分稀疏的特性,提出一种新的舍弃策略以保证不完全分解的精度和提高预条件子的构造时间。通过与直接法对比,从时间花费与内存占用两方面,分析了该算法的计算性能。理论和数值实验表明,提出的预处理方法能大大减少计算时间与分解过程所占用的内存,同时保证了计算的准确性和有效性。  相似文献   

19.
 根据拟五对角矩阵的特点,沿用追赶法的思想,首先将拟五对角系数矩阵分解成3个简单矩阵的乘积A=LUD,其中L为下三角形矩阵,U为单位上三角形矩阵,D为拟对角矩阵。然后将拟五对角线性方程组的求解问题转化为求解以下3个简单的线性方程组:Lz=f,Uy=z,Dx=y。通常的LU分解仅求解2个方程,本算法虽然将问题转化为3个方程组的求解,复杂度却没有增加,总的运算量仅为O(39n)。由于算法沿用追赶法矩阵分解的思想,对于严格对角占优的五对角线性方程组具有良好的数值稳定性。数值结果表明,算法的计算时间与方程组阶数n呈线性关系。  相似文献   

20.
为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号