首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
In Zhang's recent works,a second-order Mehrotra-type predictor-corrector algorithm for linear optimization was extended to semidefinite optimization and derived that the algorithm for semidefinite optimization had O(n~(3/2)log(X~0)~T·S~0/ε) iteration complexity based on the NT direction as Newton search direction. In this paper, we extend the second-order Mehrotra-type predictor-corrector algorithm for linear optimization to semidefinite optimization and discuss the polynomial convergence of the algorithm by modifying the corrector direction and new iterates. It is proved that the iteration complexity is reduced to O(n~(3/2)log(X~0)~T·S~0/ε), which coincides with the currently best iteration bound of Mehrotra-type predictor-corrector algorithm for semidefinite optimization.  相似文献   

2.
LetA bem byn matrix,M andN be positive definite matrices of orderm andn respectively. This paper presents an efficient method for computing (M?N) singular value decomposition ((M?N) SVD) ofA on a cube connected single instruction stream-multiple data stream (SIMD) parallel computer. This method is based on a one-sided orthogonalization algorithm due to Hestenes. On the cube connected SIMD parallel computer witho(n) processors, the (M?N)SVD of a matrixA requires a computation time ofo(m 3logm/n).  相似文献   

3.
In this paper, we propose a practical parallel algorithm for computinga b modc. The algorithm is based on RNS representatins of integers. In particular, a technique is introduced for avoiding overflow. The algorithm is easy to be implemented on hardware and achieves linear speedup.  相似文献   

4.
In this paper, we design a primal-dual interior-point algorithm for linear optimization. Search directions and proximity function are proposed based on a new kernel function which includes neither growth term nor barrier term. Iteration bounds both for large-and small-update methods are derived, namely, and . This new kernel function has simple algebraic expression and the proximity function has not been used before. Analogous to the classical logarithmic kernel function, our complexity analysis is easier than the other primal-dual interior-point methods based on logarithmic barrier functions and recent kernel functions.  相似文献   

5.
 提出了一个判定有限域上任一多项式是否为不可约多项式、本原多项式的高效的确定性算法。分析了多项式次数与其不可约因式之间的内在联系,给出了有限域上任意n次多项式是否为不可约多项式、本原多项式的一个充要条件。通过利用欧几里得算法,该判定仅需做O((log 2 n)n3)次域上乘法,属于多项式时间,易于硬件实现。为扩频通信与序列密码寻找和利用不可约多项式构造线性反馈移位寄存器提供了一种有效算法。  相似文献   

6.
并行计算是当今数值计算发展的新方向。该文在网络并行环境下探讨了并行遗传算法(PCA)进行结构优化设计及其算法的实现方法。利用4台PC机组成网络平台,进行了钢桁架结构优化设计的数值测试。计算结果表明,设计的并行算法在网络并行计算环境中具有较高的加速比和效率,同时验证了并行遗传算法用于结构优化是可行的和有效的。  相似文献   

7.
利用确定性退火技术的并行聚类算法   总被引:3,自引:0,他引:3  
划分聚类和分级聚类是两种基本的聚类手段。划分聚类常常可以转换为一个全局最优化问题 ,传统的划分聚类方法很难得到全局最优解。基于确定性退火技术 ,给出了解决划分聚类问题的一种算法 ,并给出了在集群系统上的并行化方案 ,推导出了参与并行计算的最佳处理机数目 ,给出了加速比的估算公式。通过模拟算例可知 ,该算法的特殊结构适合在机群系统上进行并行计算 ,特别对聚类点集相当大的聚类问题 ,由于任务间的通信开销与计算量相比很小 ,能够达到很好的并行效果  相似文献   

8.
We study the restricted Monte Carlo integration error for anisotropic Sobolev classes. Results prove that with O(log2 n) random bits we have the optimal order for the n-th minimal Monte Carlo integration error with arbitrary random numbers.  相似文献   

9.
彭月英 《广西科学》1997,4(2):93-96
在一维数组快速排序算法的基础上,给出了二维数组的快速排序算法,理论分析和大量的数值实验结果表明,其算法的平均计算时间仍然是O(nlog2n),一般所需的栈空间仍为O(log2n),是有效而可靠的快速排序算法。  相似文献   

10.
The design of parallel algorithms is studied in this paper. These algorithms are applicable to shared memory MIMD machines. In this paper, the emphasis is put on the methods for design of the efficient parallel algorithms. The design of efficient parallel algorithms should be based on the following considerations: algorithm parallelism and the hardware parallelism; granularity of the parallel algorithm; algorithm optimization according to the underling parallel machine. In this paper, these principles are applied to solve a model problem of the PDE. The speedup of the new method is high. The results were tested and evaluated on a shared memory MIMD machine. The practical results were agree with the predicted performance.  相似文献   

11.
最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发的优势,采用并行蚂蚁策略将MMAS在CPU-GPU协同异构计算平台上并发实现.算法在GPU上运行时的影响因素,如数据传输、内存层次、库函数调用等,也得到有效分析,并作出针对性优化.试验最终取得了高达13倍的加速,表明并行MMAS策略具有高效性和实用性.  相似文献   

12.
圆饼装填是一个将多个芯片设计组合到一个圆饼上,构造费用通过几个设计分担而减少的过程。本文在SIMD-CREW并行计算模型下,通过修改Preparata并行排序算法及其用到的Valiant并行归并算法,给出了分配2个设计到一个包的基本圆饼装填问题BWPP的并行算法,在O(n^1.5)台处理机上,算法的时间复杂性是O。  相似文献   

13.
针对对等模式下并行决策树分类算法的通信开销太大,提出了一种基于主从模式的FPM_DT并行决策树挖掘算法,此算法综合使用了横向与纵向的数据划分模型,并采用根据分支数据分布情况进行结点分组的策略.实验结果表明,它与对等模式下并行SPRINT分类算法相比,降低了通信开销,具有更好的可扩展性与加速比性能.  相似文献   

14.
针对现有的快速方差分析算法进行并行可扩展性改进, 设计一种高效的并行计算模型, 并提出一种基于MapReduce模型的基因 基因相互作用识别算法--MRANOVA算法. 该算法有效解决了现有基因 基因相互作用识别算法在海量数据规模下普遍存在计算复杂度过高的问题. 实验结果表明, 该算法充分利用了云平台的并行计算能力, 随着数据量的增大, 加速比逐渐接近于集群数量, 可高效准确地完成基因 基因相互作用的识别.  相似文献   

15.
We present a general quantum deletion algorithm that deletes M marked states from an N-item quantum database with arbitrary initial distribution. The general behavior of this algorithm is analyzed, and analytic result is given. When the number of marked states is no more than 3N/4 , this algorithm requires just a single query, and this achieves exponential speedup over classical algorithm.  相似文献   

16.
利用新的图形处理器架构重新评估利用可编程图形处理器加速标准粒子群优化算法的可行性和有效性. 针对新的图形处理器架构进行系统分析, 在此架构下实现了标准粒子群优化算法的并行版本. 实验结果表明, 通过合理运用新的图形处理器架构, 与其他标准粒子群优化算法的并行版本相比, 取得了良好的加速比.  相似文献   

17.
多序列比对问题的并行近似算法   总被引:2,自引:1,他引:2  
基于中心方法的思想,采用分治策略,在SIMD-CREW模型上设计了一个使用O(k2m)个处理器(其中k为序列个数,m为最长的序列长度),时间复杂度为O(m logk)的并行近似算法.在实际情况中,由于logk远远小于m,相对于时间复杂度为O(m2k2)的串行中心方法,该算法在理论上达到线性加速.与现有的并行算法相比,它可以适用于任意情况,且易于分析时间复杂度.利用LARPBS模型的特点和并行求前缀和的方法,调用LARPBS模型上求和与最大(小)值的并行算法,首次给出了在LARPBS模型上的多序列比对问题的并行近似算法.该算法使用O(k2m)个处理器,时间复杂度为O(m log log D),其中D为序列两两比对的代价值的最大值.该算法同样适用于任何情况,由于log log D通常远小于m,所以它在理论上也是线性加速的.  相似文献   

18.
通过构造特殊分块矩阵及其三角分解给出了求秩为n 的m×n阶Loewner型矩阵为系数阵的线性方程组极小范数最小二乘解的快速算法, 该算法的计算复杂度为O(mn)+O(n2), 而一般方法的计算复杂度为O(mn2)+O(n3) .  相似文献   

19.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

20.
提出了一种分块SVD图像滤波算法,与现有的SVD滤波方法相比,它有效地降低了存储开销,计算复杂度也由原来的O(n3)降为O(n2);同时这种分块SVD滤波方法具有很好的并行性,在曙光1000A上设计了并行处理算法,实验和分析都表明,其加速比接近处理机个数p.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号