首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出一种基于图形处理器(GPU)的对称正定稀疏矩阵复线性方程组迭代算法. 首先, 采用基于GPU的共轭梯度法和双共轭梯度法, 实现GPU上的矩阵向量乘操作, 并充分优化相应的算法步骤; 其次, 实现基于GPU的对角元预处理、 不完全Cholesky分解和对称超松弛3种预处理方法, 提出一种基于GPU的求解三角方程组并行算法; 最后, 实验分析各种预处理方法的优劣. 实验结果表明, 该算法较CPU串行迭代算法与经典的直接法速度提升较大, 最高可达到76倍的加速比.  相似文献   

2.
为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。  相似文献   

3.
针对经验风险最小化(ERM)这一无约束优化问题,使用随机优化算法.为了提高损失函数值的下降速度,考虑三项共轭梯度法的优点,提出一类新的随机三项共轭梯度算法.并将新算法与经典的随机梯度下降(SGD)类算法和已有的随机共轭梯度算法CGVR进行比较,数值结果表明新算法比SGD类算法在求解ERM问题上更有优势.  相似文献   

4.
CRS(共轭残差平方)方法是一种运用比较广泛的求解大型稀疏非对称系数矩阵线性方程组的迭代方法,然而,在很多情况下CRS方法却显示出不稳定的收敛行为.针对这个问题,提出了SCRS(平稳共轭残差平方)方法,并将SCRS方法与CGS(共轭梯度平方)方法和Bi CGSTAB(稳定的双共轭梯度)方法进行了比较.理论分析和数值实验结果显示,SCRS方法比CRS方法更为稳定,而且有着较CGS方法和Bi CGSTAB方法更好的收敛效果.  相似文献   

5.
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好.  相似文献   

6.
将自适应压力迭代法修正的Sola算法与相场模型相结合,建立过冷熔体在强迫流动状态下枝晶生长的Sola-相场模型.针对传统方法求解多场耦合相场模型时存在的计算量大,计算时间长,计算效率低等问题,提出基于CUDA+GPU软硬件体系结构的高性能计算方法.以高纯丁二腈(SCN)过冷熔体为例,在CPU+GPU异构平台上实现了存在流动时凝固微观组织演化过程的并行求解,并对基于CPU+GPU平台与CPU平台的计算结果及计算效率进行比较.结果表明,当计算规模达到百万量级时,与CPU平台上的串行算法相比,在CPU+GPU异构平台上达到了24.39倍的加速比,大大提高计算效率,并得到与串行计算相一致的结果.  相似文献   

7.
光滑支持向量机是目前的一个研究热点.牛顿-条件预优共轭梯度法Newton-PCG(Newtonpreconditioncd congugate gradient)是一种求解优化问题的更有效算法.列出了该算法用于求解光滑支持向量机的基本思想和基本步骤,还比较了原始牛顿法和牛顿-条件预优共轭梯度法的计算效率.结果表明,牛顿-条件预优共轭梯度法的计算效率明显高于原始牛顿法.  相似文献   

8.
针对压缩感知系统实时应用的需要,探讨了A*OMP算法的并行设计及基于GPU的加速方法.将耗时长的矩阵逆运算转化为可并行的矩阵/向量操作,并结合算法本身的关联特性,进一步采用迭代法实现以降低其计算复杂度.利用GPU高效的并行运算能力,将算法中可并行的矩阵/向量计算映射到GPU上并行执行,在面向Matlab的Jacket软件平台上对整体串行算法进行了并行化的设计与实现.在NVIDIA Tesla K20Xm GPU和Intel(R)E5-2650 CPU上进行了测试,实验结果表明:对比CPU平台的串行实现,基于GPU的A*OMP算法整体上可获得约40倍的加速,实现了在保持系统较高重构质量的同时能有效降低计算时间,较好地满足了系统实时性的需要.  相似文献   

9.
在线性规划问题中,为了提高算法的求解速度,快速得到最优解。对鞍点算法,共轭梯度法进行了深入研究与分析。针对鞍点算法在逼近鞍点时收敛速度变慢的缺陷,将计算比较简单且有限步迭代即可收敛的共轭梯度法成功的应用于鞍点算法中形成了一种新的算法—鞍点共轭梯度算法。以c 为开发工具,在计算机上实现了该算法,并编成一个解题系统能够快速求解线性规划问题。实验结果表明相对于鞍点算法,用鞍点共轭梯度算法计算,解题时间效率明显提高。  相似文献   

10.
为了加快大规模有界约束非线性方程组的求解,在三项HS共轭方向的基础上,构造出一个新的搜索方向,基于共轭梯度法和投影方法,提出了一种求解有界约束非线性方程组问题的修正三项HS投影共轭梯度算法.在温和的假设下,证明了新算法的全局收敛性质.数值算例表明新算法对求解大规模有界约束非线性方程组是有效且稳定的,并将其成功地应用于求解图像恢复问题.  相似文献   

11.
在现有共轭梯度方法的基础上,提出一种新混合共轭梯度法来求解无约束最优化问题.该方法采用近似方法去逼近Hessen矩阵,克服了传统牛顿法求解Hessen矩阵中存在的计算量大等问题,并在强wolfe线搜索技术下给出该共轭梯度算法的全局收敛性证明.实验结果表明,与PRP(Polak-Ribiere-Polyak)方法和HYBRID(混合)方法相比较,该文提出的新混合共轭梯度算法的迭代时间少于前两者方法,说明该文方法可行、有效.  相似文献   

12.
矩量法(MOM)是求解电磁场散射和辐射问题的一种常用数值方法,当未知量数目比较大时,其计算需要大量的时间开销.引入计算统一设备架构(CUDA)技术,在图形处理器(GPU)上实现并行MOM,并且与传统的中央处理器(CPU)串行计算比较,验证GPU计算结果的准确性.在未知量数目不同时,分析MOM中的阻抗矩阵填充和共轭梯度(CG)迭代法的加速情况.当未知量数目较大时,计算速度与CPU相比可提升数十倍.  相似文献   

13.
对求解无约束优化问题的共轭梯度法中的方向参数给定新的区间取法,将HS共轭梯度参数限制在此区间上,保证搜索方向是目标函数的充分下降方向,在此基础上提出了修正HS共轭梯度算法(MHS),并在较弱的条件下讨论了新算法在广义Armijo步长搜索下的全局收敛性.数值试验结果表明,新算法比广义Armijo步长搜索下的FR、PR、HS共轭梯度算法有效.  相似文献   

14.
共轭梯度法是求解大规模无约束问题的一种有效方法,本文针对算法的优劣主要依赖于步长因子和搜索方向的特点,结合共轭梯度法的共轭性质,在HS方法和DY方法的基础上,提出了一种混合共轭梯度法,并证明了全局收敛性.  相似文献   

15.
基于Matlab平台,采用有限元方法实现了对二维拉普拉斯(Laplace)方程在GPU平台上的加速.通过对物理问题的分析与物理模型的构建,完成总体CSR格式存储的刚度矩阵的生成;使用Matlab和CUDA混合编程,在Matlab平台上实现该有限元问题的并行加速;并结合Cu Blas数值计算库采用PCG算法求解装配后的大型线性稀疏方程组,从而高效地迭代出各格点的速度势.该算法既充分发挥了Matlab在数值计算方面的高效性,又充分发挥了GPU在细粒度并行加速方面的优势.  相似文献   

16.
针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理共轭梯度法(Preconditioned Conjugate Gradient,PCG)求解对称正定的等效静力平衡方程,最后通过MAT-LAB-CUDA(Compute Unified Device Architecture)混合平台开发基于GPU的并行计算程序.数值算例表明:基于MATLAB-CUDA混合平台求解等效静力平衡方程的效率是串行多点同步算法的86.13倍,大大缩短了随机振动分析的总计算时间,且内存占用小、易于在个人计算机上实施;采用PCG法求解车辆-轨道-地基土耦合系统形成的大型稀疏线性方程组时,建议以加速度指标作为迭代收敛精度的控制指标;可通过选取适当的迭代收敛精度,以达到计算精度和计算效率的平衡.  相似文献   

17.
结合子空间思想和Liu-Storey(LS)共轭梯度法,提出了求解大规模非负约束优化问题的可行共轭梯度算法,并分析了算法在Armijo型线性搜索下的全局收敛性.数值实例表明该算法是有效的.  相似文献   

18.
基于稳定泛函约束思想,推导了距离观测方程非线性平差的正则化共轭梯度法.该算法将稳定泛函约束作用于共轭梯度法,解决了共轭梯度法求解病态测距定位方程的不稳定甚至不收敛的问题,提高了正则化数值算法的收敛效率,最后采用模拟数据和水下定位实测数据进行了验证.实验结果表明,该算法具有较好的收敛稳定性,收敛效率优于迭代正则化算法.  相似文献   

19.
研究利用共轭梯度法求解无约束最优化问题.为了保证共轭梯度方向是目标函数的充分下降方向,对共轭梯度算法中的共轭梯度方向参数确定了一个取值范围并与Wolfe步长搜索相结合,提出了新的共轭梯度算法,使算法具有更好的收敛速度,特别是在求解大规模无约束最优化问题时,此算法只需要较小的存储.  相似文献   

20.
构造了一种混合共轭梯度法,并将其与Rosen投影梯度法相结合运用于求解线性等式约束优化问题.这种新的混合共轭梯度投影法有效改善了Rosen投影梯度法收敛性速度较慢的情况,并在Wolfe线搜索下具有全局收敛性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号