期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李伟伟《吉林大学学报(理学版)》2016,54(2):297-302

提出一种基于图形处理器（GPU）的对称正定稀疏矩阵复线性方程组迭代算法. 首先, 采用基于GPU的共轭梯度法和双共轭梯度法, 实现GPU上的矩阵向量乘操作, 并充分优化相应的算法步骤; 其次, 实现基于GPU的对角元预处理、不完全Cholesky分解和对称超松弛3种预处理方法, 提出一种基于GPU的求解三角方程组并行算法; 最后, 实验分析各种预处理方法的优劣. 实验结果表明, 该算法较CPU串行迭代算法与经典的直接法速度提升较大, 最高可达到76倍的加速比. 相似文献

2.

基于单元级矩阵分解的EBE-PCG算法及其在网络机群并行环境上的实现 总被引：2，自引：0，他引：2

叶明《淮阴师范学院学报(自然科学版)》2003,2(4):321-325

基于EBE策略，讨论求解大型线性方程组CG方法及PCG方法的并行计算．在不显式形成总刚度阵的情况下利用单元级矩阵的Cholesky分解构造总刚度阵的近似，形成预条件矩阵，提出了求解大型线性方程组的EBE—PCG并行算法，并讨论了算法在网络机群(COW)并行计算环境下的实现．结合实际算例，对EBE-PCG并行算法进行了并行效率分析．结果表明基于单元级Cholesky分解的EBE—PCG算法具有很好的并行效率，是一种适合网络机群并行环境的高效并行算法．相似文献

3.

一阶常微分方程组的一个有效解法

吕和祥董志强陈建峰《大连理工大学学报》2006,46(5):629-632

对于一阶常微分方程组，将具有导数变量的系数矩阵作三角化分解，使其简化成单位矩阵．应用具有三阶精度、单步自起步、无条件稳定的隐式算法对一阶常微分方程组进行了简化，改进了Calahan算法．其中逆矩阵与矩阵的乘积，是通过矩阵三角化回代求解计算，从而回避了矩阵求逆．该算法保留了原方程组系数矩阵的稀疏存储方式和稀疏矩阵的运算规则，减少了计算时间和运算过程所需要的存储空间．相似文献

4.

基于OpenMP和Pardiso的柔性多体系统动力学并行计算

曹大志强洪夫任革学《清华大学学报(自然科学版)》2012,(11):1643-1649

为加快大型、复杂柔性多体系统的动力学仿真的速度,对多体系统动力学的并行算法进行研究。首先分析了微分代数方程(differential algebraic equations,DAEs)在数值计算求解过程中主要的计算量。据此,提出采用OpenMP并行计算系统的刚度矩阵、右端项和采用并行的稀疏线性方程组求解器Pardiso对线性方程组进行求解的并行策略。将这两种并行策略应用到自主开发的柔性多体系统动力学软件THUSolver中,实现了对多体系统动力学的并行计算。通过两个工程算例的仿真得到并行的加速比和计算效率,结果表明:采用的两种并行策略都有很高的计算效率,能大幅提高多体系统动力学仿真的速度。相似文献

5.

基于奇偶二分法的并行Gauss消去回代过程的研究

王得良安敏《科技信息》2007,(14)

本文以取Gauss消去法的回代过程即三角方程组的并行化为研究对象,重点研究了用基于奇偶二分法的并行算法来求解三角方程组。给出了二分法的矩阵表示形式,并举实例验证了该算法的高效性。相似文献

6.

不完全LU分解预处理的BICGSTAB算法在大地电磁二维正演模拟中的应用 总被引：6，自引：0，他引：6

柳建新蒋鹏飞童孝忠徐凌华谢维王浩《中南大学学报(自然科学版)》2009,40(2)

基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式.针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩阵,求解其对应方程组会遇到很多困难等问题,采用不完全LU分解(即上三角与下三角分解)处理的稳定双共轭梯度算法(BICGSTAB算法)求解该线性方程组,通过对层状介质和二维模型电磁响应进行计算,获得二维大地电磁的视电阻率曲线和阻抗相位曲线.研究结果表明,BICGSTAB算法具有速度快、精度高和稳定性好等优点. 相似文献

7.

WZ分解的一种新的并行算法

陆益君《华中科技大学学报(自然科学版)》1988,(4)

本文对n阶非奇异实稠密矩阵A的WZ分解提出了一种新的并行算法。用n~2台处理机,我们可以在3n-2步内求得矩阵A的WZ分解。该算法与文献[1]中的方法相结合,可得并行求解线性方程组的另一种有效算法。文中所提及的算法均适用于SIMD型并行计算机。相似文献

8.

一类稀疏线性方程组的并行求解方法

韩莉仵莉《辽宁师范大学学报(自然科学版)》1996,19(4):278-281

本文给出了适合于系数矩阵为嵌套的ＢＤＤ的大型稀疏方程组的ＬＵ并行分解的求解算法，它可以提高运算速度，减少运算量，从而使迭代法在大规模电路模拟计算中得到充分利用，通过具体电路实例说明了这种方法的实用性相似文献

9.

拟极小残差法在GPU上的优化研究

赵宁秦策徐玉聪《科学技术与工程》2014,14(7):225-228

随着GPU在高性能计算领域更多地用于科学计算,采用GPU技术对大型稀疏线性方程组进行计算,从而满足人们对计算速度和计算精度要求的提高。NVIDIA Fermi架构的开发,大大提升了GPU的双精度浮点运算能力。拟极小残差法(QMR)作为高性能计算领域中的重要迭代算法,基于求解稀疏代数方程组对ELL算法进行GPU优化。通过对不同规模线性方程组计算分析表明,QMR-GPU的性能提升为原始QMR的3.5倍,与传统的BICG法相比,QMR并行算法具有速度和存储优势,可获得良好的并行加速比。相似文献

10.

弹性波动方程数值解的有限元并行算法

王月英孙成禹《石油大学学报(自然科学版)》2006,30(5):27-30

在求解弹性波动方程中,有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足,制约其优势的发挥.根据有限元法的"化整为零、集零为整"的基本思想与并行处理技术的"分而治之"的原则基本一致,采用基于多CPU的并行算法,从有限元参数矩阵计算和线性方程组求解两个方面入手,把求解区域分到多个CPU上并行计算参数矩阵,对线性方程组采用循环块三对角线方程组进行并行求解.对比了不同大小空间和不同CPU个数下的加速比,证实了多CPU的并行算法能够克服基于单CPU串行算法的物理限制,满足了有限元法的巨大空间量和运算量的需求.此算法具有理论上的正确性和实践上的可行性. 相似文献

11.

弹性波动方程数值解的有限元并行算法

王月英孙成禹《中国石油大学学报(自然科学版)》2006,30(5):27-30

在求解弹性波动方程中，有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足，制约其优势的发挥。根据有限元法的“化整为零、集零为整”的基本思想与并行处理技术的“分而治之”的原则基本一致，采用基于多CPU的并行算法，从有限元参数矩阵计算和线性方程组求解两个方面人手，把求解区域分到多个CPU上并行计算参数矩阵，对线性方程组采用循环块三对角线方程组进行并行求解。对比了不同大小空间和不同CPU个数下的加速比，证实了多CPU的并行算法能够克服基于单CPU串行算法的物理限制，满足了有限元法的巨大空间量和运算量的需求。此算法具有理论上的正确性和实践上的可行性。相似文献

12.

求解稠密线性方程组的并行算法研究

裴伟东《天津师范大学学报(自然科学版)》1998,(3)

基于对稠密线性方程组系数矩阵的一种新的分解方法,给出了分解与求解过程的并行算法,并分析了利用Ｐ台处理机并行运算时的加速比 相似文献

13.

求解大型线性稀疏方程组改进的中心线法

杜红母丽华沈继红《科技导报(北京)》2009,27(13):88-91

求解线性方程组问题本是一个非常古老的数学问题,已进行了大量的研究.但随着科学技术的发展.求解问题的系数矩阵的规模变得越来越大,求解大规模稀疏矩阵的线性方程组问题已经成为科学计算中的最重要的问题之一.求解大型线性稀疏方程组的中心线法于1986年提出,文献[7]对其进行了部分改进,本文通过改进文献[7]中偏离中心线的偏离度,重新定义中心线向量,提出了一种与初始向量的选取无关的大范围收敛的迭代算法.与文献[7]的算法比较,本文提出的算法具有大范围收敛、计算量小、精度高的优点. 相似文献

14.

列扰动的线性方程组的ABS算法

罗雁珠诸梅芳《河南科技大学学报(自然科学版)》1992,(1)

本文讨论在用ABS算法求得某线性方程组的解之后,如何有效地利用求解过程中所得到的信息,求解增加若干个变量或减少若干个变量所得到的新的方程组。本文的算法是基于ABS算法而提出的,它们适用于反复求解不断增加变量和减少变量的问题。计算量分析表明,与完全重新求解新方程组比较,本文所提出的方法可以较多地节省计算量。相似文献

15.

求解稠密线性方程组的并行算法研究

裴伟东《天津师大学报》1998,18(3):20-25

基于对稠密线性方程组系数矩阵的一种新的分解方法，给出了分解与求解过程的并行算法，并分析了利用Ｐ台处理机并行运算时的加速比。相似文献

16.

电子电路机助分析和设计中的稀疏矩阵技术

张奠成姚栋义《合肥工业大学学报(自然科学版)》1981,(2)

本文就电子电路机助分析与设计中的稀疏矩阵技术进行了分析和讨论。文中首先论述了求解线性方程组在电路机助分析与设计中的重要性,以及稀疏矩阵技术的主要问题,接着结合电路方程组的特点,就稀疏矩阵的排序、存贮和编程技术进行了比较和论述。最后介绍了稀疏矩阵分块技术以及平行算法等问题,附录中介绍一种求解不对称高稀疏线性代数方程组的有效算法。相似文献

17.

带形对称线性系统的并行算法

谷艺谷元《曲阜师范大学学报》1996,22(3):37-40

对带形对称系统提出了新的并行算法，在划分基础上充分利用矩阵的稀疏性，使算法具有高的分解效率及并行加速比。相似文献

18.

一种用于计算矢量有限元方程组的不完全分解预处理方法

田瑾龚利史小卫徐乐《重庆邮电大学学报(自然科学版)》2012,24(3):349-353

提出一种不完全分解预处理方法,并结合迭代法计算矢量有限元方程组。预处理方法采用基于拓展乔里斯基分解的多波前法对有限元方程组的系数矩阵进行分解和更新,并采用基本线性代数系统库函数计算稠密矩阵乘来保证算法内层循环的高效率。该预处理算法在对系数矩阵进行数值分解前引入缩放矩阵以改善矩阵条件数。针对有限元方程组系数矩阵稀疏或部分稀疏的特性,提出一种新的舍弃策略以保证不完全分解的精度和提高预条件子的构造时间。通过与直接法对比,从时间花费与内存占用两方面,分析了该算法的计算性能。理论和数值实验表明,提出的预处理方法能大大减少计算时间与分解过程所占用的内存,同时保证了计算的准确性和有效性。相似文献

19.

追赶法求解拟五对角线性方程组

李文强马民李卫霞《科技导报(北京)》2010,28(18):60-63

根据拟五对角矩阵的特点,沿用追赶法的思想,首先将拟五对角系数矩阵分解成3个简单矩阵的乘积A=LUD,其中L为下三角形矩阵,U为单位上三角形矩阵,D为拟对角矩阵。然后将拟五对角线性方程组的求解问题转化为求解以下3个简单的线性方程组：Lz=f,Uy=z,Dx=y。通常的LU分解仅求解2个方程,本算法虽然将问题转化为3个方程组的求解,复杂度却没有增加,总的运算量仅为O（39n）。由于算法沿用追赶法矩阵分解的思想,对于严格对角占优的五对角线性方程组具有良好的数值稳定性。数值结果表明,算法的计算时间与方程组阶数n呈线性关系。相似文献

20.

基于CUDA的大规模稀疏矩阵的PCG算法优化

郑经纬安雪晖黄绵松《清华大学学报(自然科学版)》2014,(8):1006-1012

为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。相似文献