首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
本文利用对称矩阵的正交标准形,讨论了把称半正定矩阵分解成若干个对称半正定矩阵乘积的问题,并给出了与此有关的几个性质。  相似文献   

2.
本文利用对称矩阵的正交标准形,讨论了把对称半正定矩阵分解成若干个对称半正定矩阵乘积的问题,并给出了与此有关的几个性质。  相似文献   

3.
在分析对称正定矩阵的校正分解算法的基础上,提出了解决对称不定矩阵的校正分解算法,一对称不定矩阵的Bunch-Parlett分解需要0(n^3)次运算,而根据对称不定矩阵的Bunch-Parlett分解得到的Bunch-Parlett校正分解算法仅需0(n^2)次运算,数值结果也比较稳定。  相似文献   

4.
利用对称矩阵的正交标准性 ,讨论了把对称半正定矩阵分解成若干个对称半正定矩阵乘积的问题 ,并给出了与此有关的几个性质  相似文献   

5.
提出一个复矩阵是对称酉矩阵的充要条件,并用逻辑上类似的方法证明一个类似于复对称正规矩阵的复斜对称正规矩阵的分解,最后对复斜对称矩阵得到了类似于复对称矩阵Takagi分解的结论.  相似文献   

6.
7.
酉对称矩阵的满秩分解及其算法   总被引:4,自引:0,他引:4  
对酉对称矩阵的满秩分解算法作了研究,证明了酉对称矩阵的满秩分解矩阵F^*和G^*与母矩阵A的分解矩阵F和G之间的定量关系,同时给出了满秩分解的两种快速算法。最后对酉对称矩阵的部分广义逆-g逆,反射g逆,最小二乘g逆,最小范数g逆问题作了定量分析,也得到了相应的算法,并在文后举例给以说明所得算法大大降低了酉对称矩阵的满秩分解的计算量和存储量,提高了计算效率。  相似文献   

8.
给出了双对称矩阵的定义,研究了双对称矩阵的性质.讨论了双对称矩阵的奇异值分解的新算法,此算法可极大地减少双对称矩阵的奇异值分解的计算量与存储量.给出了Matlab程序语言,并用具体例子验证了结论的正确性.  相似文献   

9.
给出全对称矩阵中具有轴对称结构矩阵(延拓矩阵)的满秩分解及Moore-Penrose逆与原矩阵的满秩分解及Moore-Penrose逆的定量关系,从而可节省这类具有该对称结构矩阵的满秩分解及Moore-Penrose逆的计算量和存储量.  相似文献   

10.
本文用Givens变换,给出一个对称稀疏矩阵的三对角化并行算法,具有很好的并行加速及效率,由于充分考虑了矩阵的稀疏性,使算法中数据存储及通讯相当节省。  相似文献   

11.
并行计算作为计算机行业未来发展方向的趋势已显而易见,而并行程序设计是研究的一个重要分支。介绍了ADPCM算法的基本概念,阐述了ADPCM算法并行化的设计与实现,分析了ADPCM并行算法的效率。  相似文献   

12.
介绍了OpenMP的并行执行原理和语言规范,重点讨论了OpenMP的循环并行化、迭代相关、数据共享、任务调度等问题,最后使用OpenMP技术优化了遗传算法,并进行了性能的对比.  相似文献   

13.
基于共享内存的高效OpenMP并行多层快速多极子算法   总被引:2,自引:1,他引:1  
提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.在分析调度方式和循环次序对计算效率的影响的基础上,提出了一种高效的OpenMP并行多层快速多极子方案.数值实验表明,并行算法与串行精度一致,OpenMP并行算法具有较好的并行效率.  相似文献   

14.
基于MPI+OpenMP的多层次并行偏移算法研究   总被引:1,自引:0,他引:1  
根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法.从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多层次并行叠前深度偏移算法.理论模型验证了其正确性,得到了较好的成像效果,不同类型的多层次并行偏移算法计算结果有所差异.多层次并行偏移算法是在实现MPI并行偏移的基础上,对集群各节点内核的充分利用,有利于提升PC集群的计算性能,为叠前深度偏移的实际推广奠定基础.  相似文献   

15.
在同位网格上建立了基于重叠型区域分解的并行SIMPLER算法,给出了区域划分和数据交换的实施细则.并在集群系统下通过对顶盖驱动方腔流进行模拟验证了算法的可靠性.数值结果表明,加速比成线性增加,随着计算规模的增大,并行效率可达到95%以上.  相似文献   

16.
随着高速网络技术的快速发展,机群系统已经成为并行计算的主要平台,由于它的高通信延迟,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行,为此有必要研究它们在机群系统中的并行实现。基于这一点,对矩阵的QR分解提出了一种新的任务划分策略,并由此得到了它的一种粗粒度并行算法。实验结果表明,设计的并行算法在机群系统中具有较高的加速比。  相似文献   

17.
随着高速网络技术的快速发展,机群系统已经成为并行计算的主要平台,由于它的高通信延迟,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行,为此有必要研究它们在机群系统中的并行实现.基于这一点,对矩阵的QR分解提出了一种新的任务划分策略,并由此得到了它的一种粗粒度并行算法.实验结果表明,设计的并行算法在机群系统中具有较高的加速比.  相似文献   

18.
针对二维经验模分解(BEMD)处理大尺寸图像耗时较长的问题,提出了一种基于MPI技术的BEMD并行算法.对BEMD串行程序中极值点选取、平面三角剖分、三角域内数值插值等几个主要部分的运行时间进行了统计,结果表明三角域内数值插值是耗时的主要部分,也是并行化的重点处理部分;随后在高性能计算平台上构建并行环境,基于MPI技术对BEMD算法的包络面生成部分实现了并行化,具体方法是先将剖分后的三角形序列按照进程数均匀划分,使整个图像分割为若干子区域并分配给相应进程,然后各进程拟合出对应子区域的上下Bezier曲面并由0进程进行合并,进而生成上下包络面;最后通过加速比等指标对该算法进行测评.结果表明,算法在30核并行执行时加速比可达20.1396,利用率为64.97%,运行效率的提升较为明显.在数据量达到原始数据的25倍时可扩展性指标为1.3975,表明该算法对大数据量的任务有很好的适应性.   相似文献   

19.
实对称矩阵特征值分解高速并行算法的FPGA实现   总被引:1,自引:0,他引:1       下载免费PDF全文
针对MUSIC(Multiple Signal Classification,多重信号分类)算法中的信号子空间和噪声子空间分离的硬件实现实时性需要,对矩阵特征值分解的Jacobi算法进行了并行改进,采用脉动阵列结构在FPGA(Field Programmable Gate Array)上高速并行实现了对数据协方差矩阵的特征值分解。采用矢量模式CORDIC算法和旋转模式CORDIC算法实现脉动阵列结构的细胞单元。系统字长选用16 bit定点数,采用硬件描述语言VHDL进行描述,在Altera公司的EP2S60中实现。整个特征值分解模块消耗24 372个FPGA中基本逻辑单元(LE),系统最高工作频率145 MHz,完成一次特征值分解的最低耗时为14.82μs。通过理论分析和实验验证,该实现方法精度高、速度快,大大提高了MUSIC算法的实时性,扩大了MUSIC算法的应用范围。  相似文献   

20.
数据分布是提高分布存储系统上OpenMP程序性能的主要方法之一.基于两阶段分析方法,提出了一个面向OpenMP程序的自动数据分布框架及算法并实现其于CCRG OpeMP编译器之中.第一阶段,编译器分析程序中数据访问模式,结合OpenMP程序中DO指导命令提供的任务调度信息,为每次数组访问产生分布方式候选;第二阶段,采用多面体作为迭代空间及数组空间的几何模型,提出自动计算有界多面体中整数点个数以衡量通信量之多少的方法,并且用Ehrhart多项式表示其结果以更便于符号比较和最优分布方式的选取.实验表明,在最终选取的分布方式下,程序性能明显优于其他候选分布方式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号