首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出了基于消息传递的刀位轨迹并行计算方法.该方法首先将串行计算任务合理的划分成若干并行子任务,然后动态的分配到各处理机上,能充分利用网络中空闲的计算资源,提高计算速度.分别应用于投影法和自适应投影法编程,试验结果表明该方法具有令人满意的并行加速比.  相似文献   

2.
The role the quantum entanglement plays in quantum computation speedup has been widely disputed. Some believe that quantum computation's speedup over classical computation is impossible if entan-glement is absent,while others claim that the presence of entanglement is not a necessary condition for some quantum algorithms. This paper discusses this problem systematically. Simulating quantum computation with classical resources is analyzed and entanglement in known algorithms is reviewed. It is concluded that the presence of entanglement is a necessary but not sufficient condition in the pure state or pseudo-pure state quantum computation speedup. The case with the mixed state remains open. Further work on quantum computation will benefit from the presented results.  相似文献   

3.
基于工作站机群的并行频域体绘制   总被引:1,自引:1,他引:1  
体绘制是三维数据场可视化中的一类重要算法,近年来人们分别通过对频域技术和并行技术的研究和应用使得这类算法有了很大的提高,然而迄今为止,这两个方面的成果仍然没有能够有机地结合起来。有鉴于此,本文介绍了一个基于工作站群机环境的并行频域体绘制算法。由于该算法充分发挥了频域技术和并行技术的优点,有效地提高了绘制速度。已在一个工作站机群环境中具体实现。对于该算法的各方面性能,文中都给出了详细的测试统计数据。  相似文献   

4.
代数多重网格与多波前技术综合并行有限元分析方法   总被引:1,自引:0,他引:1  
提出一种新的有限元并行计算格式,将代数多重网格、块迭代与多波前技术综合用于有限元分析,具有不限制节点编号顺序、编程简单、存储量小和计算时间少的优点。并行程序是在国家高性能计算中心(北京)的曙光1000A上借助PVM(Parallel Virtual Machine)软件系统实现的,PVM系统用于处理各计算节点间的通信。考题显示出较高的并行加速比和效率。  相似文献   

5.
基于多步法绘制原理和Brensenham算法,提出一种新的关于抛物线的线性化裁剪算法。该算法首先线性化计算,由给定抛物线生成绘制时所需的两个数组,然后考虑到各种裁剪情况,利用两数组实现抛物线与窗口裁剪线的求交运算,得到相应的裁剪数据,最后再绘制出所求的裁剪图形。  相似文献   

6.
为解决现有航海模拟器视景系统中对太阳及镜头光晕的模拟不完善、无法显示太阳、不能控制太阳及镜头光晕效果等问题,提出基于OpenGL和Cg绘制太阳及镜头光晕的方法.讨论光晕分布、纹理及融合等技术,并引入光晕边界的概念,实现光晕的淡入淡出.采用光线投射方法判断太阳与其他物体的遮挡关系,解决了z缓冲区方法无法判断视见体外物体的可见性问题,并利用顶点着色器技术对该方法进行优化.结果显示,该法简单,易于实现,绘制效果真实,满足航海模拟器对视景系统的实时性和逼真度要求.  相似文献   

7.
地形可视计算在军事侦察、土地管理以及建筑学等领域都有重要的研究意义。地形可视计算领域的LOS(line ofsight)算法有在空间上计算不平衡的问题。提出了一种分层地形可视计算的改进方法。该方法通过对地形区域进行分层,使地形可视计算在空间上相对平衡。与增量法进行比较,运算效率有了较大的提升。  相似文献   

8.
针对传统并行操作计算效率低的问题,提出以分组并行处理模式优化节点间的负载均衡。以表层浮标轨迹验证涡旋实验为例,给出面向不可分割空间线对象的快速分组方法,设计了两个分组调整算法。实验结果显示,算法可以使每个计算节点达到负载均衡。与串行计算的比较实验结果显示,算法具有较好的加速效果,且加速比随着计算节点个数的增加呈上升趋势。因此,基于负载均衡的空间线分组算法是对不可分割空间线的计算进行优化的有效途径。  相似文献   

9.
A new compact level-of-detail representation, called hierarchical surface fragments, for geometric objects with highly complex shape is presented. The representation comprises a set of irregular unstructured sampled surface fragments, whose boundary is a circle viewed along its normal. An efficient algorithm to construct the representation is described. In depiction of the framework for visualization, a screen tile technique for acceleration of rendering is proposed. Since an approximate z-buffer algorithm is adopted to fast determine visibility of each rendering primitive, a new buffer, z-delta-buffer, is designed to facilitate solving the problems raised by the approximation and to improve the image fidelity. Finally, a solution is provided to integrate our rendering approach for hierarchical surface fragments with traditional polygon-based methods.  相似文献   

10.
提出一个适合于工程系统的二层优化设计方法,该方法把原始问题分解为两层优化问题,顶层为协调系统优化,底层为若干个子系统优化.为了实现该方法的并行分布式计算,在局域网内建立了一个基于PVM的计算环境.一个3 126杆的空间桁架的优化设计实例验证了该算法的收敛性,并分析在并行分布环境下的加速比和并行效率.  相似文献   

11.
利用区域分解方法,对模拟大气重力波在中高层大气中非线性传播过程的数值模式进行了并行化处理,从而建立了并行数值模式.在两个并行机群上对并行数值模式的测试结果表明:在千兆以太网和内存配置较低的机群系统上,并行效率随着进程个数的增加而减低,当进程个数增加到16时,并行效率仅为0.65.在内存配置较高的机群系统上,并行效率随着进程个数的增加并不减小,甚至出现了超线性加速现象.比如当进程个数为160个时,并行效率达到1.28.通过比较研究可以说明,机群系统的缓存、物理内存和网络通讯延时都是影响加速比的重要因素.尽可能大的缓存和物理内存能够有效提高加速比,网络交换机的选择需要在延时和带宽间进行权衡.  相似文献   

12.
A doubly clamped microbeam actuated by electrostatic force with squeezed gas film damping is a well-known and standard micro-device in microelectromechanical system (MEMS) for many researchers to demonstrate how reduced-order dynamic macromodel is an effective way to faithfully capture the device behaviors. However it still takes time to directly recompute the time-dependant nonlinear terms in macromodels which are generated by a proper orthogonal decomposition (POD) method with Galerkin procedure at every time step during the macromodel simulation. This paper proposes two methods for speeding up the computation of macromodel simulations. In the first method, the computation speedup is achieved based on the concept of precomputation upon the basis functions are available. In the second method, cubic splines approximation is used to interpolate the basis functions and their first and second derivatives, and spatial integration is performed by application of the Gaussian quadrature. Numerical results show both methods could enhance the efficiency of the macromodel simulation compared with our previous computation results  相似文献   

13.
科学计算的可视化技术在计算机辅助工程应用的后置处理中占有重要位置,本文介绍了在微机平台上对空间体数据以投影方式快速绘制技术的研究,就实现过程中的一些关键问题如模板及空间体元可见性排序等进行了探讨。研究的成果已应用到铸造的分析计算过程中。  相似文献   

14.
提出了一种基于FMM求解多体问题的PP计算在FPGA加速部件上进行计算加速的实现方法.通过在对FMM算法中PP计算过程的原代码的计算类型分析与代码转化,给出了在FPGA上的具体实现方案,最后,通过Virtex-5实验平台的计算结果表明能够取得20倍左右的稳定加速效果.  相似文献   

15.
光线投射法是一种重要的体绘制算法,但直线上采样点的确定和采样值计算是非常费时的,也是影响体绘制实时性的重要因素.针对这个问题,该文利用对象空间的相关性,采用舍弃贡献不大的射线段参与采样的方法,加快了绘制速度.同时利用平面簇的交点可以快速求得直线上的采样点及其特征值,结合自适应采样方法,提高了绘制图像的质量.改进以后的算法复杂度明显降低,实验结果证明绘制速度可以提高20%左右.  相似文献   

16.
为了能够有效提高基于时域的SAR回波仿真的运行速度,本文提出了一种基于GPU架构的SAR回波仿真优化实现方法。该方法结合GPU的计算密度高、高度并行的特点并利用CUDA流在GPU上同时执行多个任务,实现任务并行、指令并行和数据并行的三重并行,极大地挖掘了回波模拟全过程的并行性,缩短了回波仿真的运算时间。实验结果表明,该方法相对于传统的CPU上的串行算法平均加速比达到128倍,可用于实时信号处理。  相似文献   

17.
通过分析卡通画的艺术特点,提出一种基于扫描线的卡通风格渲染方法,首先对用户输入的图像进行边缘检测提取出轮廓,然后进行颜色的均一化处理,最后得到具有卡通风格的结果图像.为了满足本算法的要求,提出了基于直方图的边缘检测参数的计算和基于扫描线的颜色处理两个算法,能够自动、实时地完成渲染过程.实验结果表明,本方法的渲染效果更接近于手绘风格,且无需用户交互,适合于卡通动画和个性化照片等领域的应用.  相似文献   

18.
利用确定性退火技术的并行聚类算法   总被引:3,自引:0,他引:3  
划分聚类和分级聚类是两种基本的聚类手段。划分聚类常常可以转换为一个全局最优化问题 ,传统的划分聚类方法很难得到全局最优解。基于确定性退火技术 ,给出了解决划分聚类问题的一种算法 ,并给出了在集群系统上的并行化方案 ,推导出了参与并行计算的最佳处理机数目 ,给出了加速比的估算公式。通过模拟算例可知 ,该算法的特殊结构适合在机群系统上进行并行计算 ,特别对聚类点集相当大的聚类问题 ,由于任务间的通信开销与计算量相比很小 ,能够达到很好的并行效果  相似文献   

19.
图形硬件加速的实时阴影生成方法   总被引:6,自引:0,他引:6  
针对虚拟环境中阴影计算时间耗费较大的问题,提出了利用图形硬件特性加速阴影绘制的方法.算法基于图像空间,采用三遍绘制方法.第3遍绘制用于计算物体的真实感光照,并对阴影边界的走样现象进行了处理.利用硬件的图形处理单元GPU的处理能力和OpenGL特性扩展,在GPU编程和通用OpenGL实现两个层次上进行了实验,实验结果表明,三遍绘制方法产生的光照和阴影效果更真实,得到的阴影边界更平滑.  相似文献   

20.
3D reverse time migration in tiled transversly isotropic (3D RTM-TTI) is the most precise mod-el for complex seismic imaging.However, vast computing time of 3D RTM-TTI prevents it from be-ing widely used, which is addressed by providing parallel solutions for 3D RTM-TTI on multicores and many-cores.After data parallelism and memory optimization, the hot spot function of 3D RTM-TTI gains 35.99X speedup on two Intel Xeon CPUs, 89.75X speedup on one Intel Xeon Phi, 89.92X speedup on one NVIDIA K20 GPU compared with serial CPU baseline.This study makes RTM-TTI practical in industry.Since the computation pattern in RTM is stencil, the approaches also benefit a wide range of stencil-based applications.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号