首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 406 毫秒
1.
DSP具有能效比高的特点,可以用于通用高性能计算.矩阵乘是许多科学与计算问题的核心算法,在DSP上取得高性能具有重要的理论和现实意义.面向通用DSP,提出了矩阵乘并行算法,建立了矩阵乘峰值性能模型,根据性能模型,构建了矩阵乘性能达Tflops级DSP体系结构参数配置,对通用DSP的设计参数给出了明确的性能指标要求,包括乘加流水线数量、寄存器数目、带宽和延迟.  相似文献   

2.
李朝鹏 《科技信息》2010,(10):14-14
本文提出一种基于图形出理器的并行邻接矩阵算法,算法利用了图形处理器子素级的向量处理能力完成对n个数据点邻接矩阵的计算,将提出算法与现有算法进行的性能对比分析表明:本算法明显改进了现有文献的研究结果,是一种低成本的邻接矩阵算法。  相似文献   

3.
并行计算是遥感图像快速处理的基本方法,而并行算法则是实现这种方法的关键之一.针对星载SAR图像几何校正中单幅图像的快速处理问题,首先分析了一种串行校正算法的可并行特征,随后分别设计了一种面向多CPU/核和一种面向GPU的全局并行校正算法,并利用2幅星载SAR图像测试了多种数据粒度下这2种算法的加速效能.实验结果表明,这2种并行算法可以大幅提高星载SAR图像的几何校正速度;CPU并行算法的性能主要与CPU/核心数目有关,而GPU并行算法则主要与数据粒度有关;后者具有很高的加速比,是几何校正的高效方法.  相似文献   

4.
描述了DNS、Cannon、Fox、Systolic矩阵乘并行算法的原理,并对其时间复杂度进行了理论分析。通过对并行算法的各项性能参数的对比分析,得到的结论是DNS算法的时间复杂度最好,但加速比、效率和成本不是最优的。Cannon算法和Fox算法的算法思想类似,但是Cannon算法比Fox算法在数据播送上的花费少,因此整体性能较好。Systolic算法是基于流水线技术的并行矩阵乘算法,有较好的综合性能。  相似文献   

5.
救援机器人可以在灾害发生后,协助工作人员立即进行勘察援助,其进行全局路径规划的能力是影响机器救援性能的关键技术之一。蚁群算法对于全局路径规划问题具有随机搜索能力强的特点,但其参数的选择对于最终性能有直接的影响,针对此问题提出了运用单因素法对蚁群算法中的信息素启发因子α和距离启发因子β、信息素挥发系数ρ、信息素强度Q,蚂蚁数目和救援点数目分别进行独立分析研究,通过仿真实验统计算法性能中距离和迭代次数的相关数据,进而确定出最优化参数组合。结果表明,确定最优参数组合后路径规划正确和高效,为该算法参数的相关研究提供有利支撑。  相似文献   

6.
网格计算是近年来逐渐兴起并不断发展的技术,目前广泛应用于分布式超级计算、分布式仪器系统、数据密集型计算和远程沉浸等多个研究领域。常规人脸识别系统中的更新算法都是基于单机的串行算法,在处理大量数据的时候速度慢,效率低,介绍了网格计算在人脸识别系统中的应用,把原来的人脸数据更新串行算法改为并行算法并通过编写MPI并行程序移植到该网格计算平台中运行,实现了原有人脸识别系统中更新算法的分布式处理,增强了系统处理大量数据的能力,以达到提高系统性能的目的。  相似文献   

7.
聚类是一种重要数据分析技术,在众多领域中得到广泛地应用.然而,由于数据分布的内在特点,传统的聚类算法并不能保证聚类结果具有平衡性,这与很多现实的需求不一致.本文提出了一种基于K-Means的平衡约束聚类算法,该算法对K-Means算法每次迭代中数据点的分配策略进行修改,达到对每个簇可包含的数据点数目上限进行约束的目的.同时,算法支持用户自定义簇可包含的数据点数目上限,满足不同的平衡约束聚类需求.另外,本算法参数少,只需设置目标簇数目及其可包含的数据点数目上限,时间复杂度低,具有简单、快速的特点.在6个UCI(University of California Irvine)真实数据集上进行的实验结果表明,文中提出的平衡约束聚类算法相比其他平衡约束聚类算法具有更佳的聚类效果和时间性能.  相似文献   

8.
数制之间相互转换的并行算法   总被引:4,自引:0,他引:4  
数制转换是计算机科学中一种最基础的运算,但现有的算法基本上都是串行算法。随着并行计算机的出现,并行算法的研究也越来越受到人们的重视。要发挥并行计算机的作用,提高并行计算机资源的利用率,必须有一套强有力的并行算法的支持。本文给出了十进制与其它进制之间相互转换的并行算法,并对算法的性能进行了分析。  相似文献   

9.
提出了一种基于网络的应用层数据检测并行算法(Parallel Application layer Inspection Algorithm,PAIA).本算法可应用在基于网络的病毒检测系统的分布式节点上,通过实验证明,此算法能有效提高系统的性能.  相似文献   

10.
一种新的概念格并行构造方法   总被引:5,自引:0,他引:5  
概念格在数据分析及机器学习等很多领域得到了广泛的应用,其构造算法的时空开销随着数据规模的不断增大而迅速增长,这一问题一直困扰着格的进一步应用。因此,设计更加有效的建格算法是非常重要的。文章结合批生成算法的并行性和渐进式算法高效性的优点,提出了一种新的并行算法;实验表明,该算法的时间性能和空间性能都有明显的提高。  相似文献   

11.
为进行分组密码并行处理的理论研究和定量分析,构建了基于Amdahl定律的分组密码并行处理模型.通过引入分组内数据级并行性、分组内指令级并行性、分组间数据级并行性和分组间指令级并行性等并行性,建立了分组密码的多维度并行处理模型,研究了算法参数和并行参数对分组密码处理性能的影响.结果表明,并行比例大的算法其性能提升空间较大,且开发任一并行性都能够提升密码运算性能;但对于具体的应用场景,需要根据算法结构、工作模式等来进行合理的资源配置和并行性开发;该模型能够为分组密码算法的并行处理架构设计、资源配置和并行性开发等提供理论依据和指导原则.   相似文献   

12.
针对机器学习算法超参数寻优效率低的问题和参数寻优主流算法的特点,提出了一种基于参数并行机制的机器学参数寻优方法。该方法利用群启发式算法来进行机器学习算法的参数寻优,将种群转换为Spark平台特有的弹性分布式数据集,针对参数寻优耗时特点并行计算种群中个体适应度。选取随机森林和遗传算法作为实验算法设计了多组实验对所提出的学习训练方法进行验证。实验结果表明,在20万条以下的小数据量下,文中提出的基于参数并行机制的机器学习参数寻优方法与基于数据并行机制的机器学习参数寻优方法相比,运行时间最多能够减少2个小时,并具有良好的可扩展性。  相似文献   

13.
基于MapReduce的中文词性标注CRF模型并行化训练研究   总被引:1,自引:0,他引:1  
针对条件随机场模型面对大规模数据传统训练算法单机处理性能不高的问题, 提出一种基于MapReduce框架的条件随机场模型训练并行化方法, 设计了条件随机场模型特征提取及参数估计的并行算法, 实现了迭代缩放算法的并行。实验表明, 所提出的并行化方法在保证训练结果正确性的同时, 大大减少了训练时间, 效率得到较大提升。  相似文献   

14.
以螺旋面钻尖刃磨为研究对象,基于二并联机床优化磨削参数,为实现所需的几何参数螺旋面钻尖刃磨提供理论与实验基础.介绍了基于二并联机床的渐开螺旋面刃磨方法,针对螺旋面钻尖后刀面推导了数学模型.分析了二并联机床的磨削参数与螺旋面钻尖几何参数的关系,然后用遗传算法得出螺旋面钻尖刃磨参数优化解.在二并联机床上进行刃磨实验,结果表明,采用本文的优化刃磨参数提高了刃磨精度,并验证用二并联机床可以刃磨出满足用户几何参数要求的螺旋面钻尖.  相似文献   

15.
One of the key issues for parallel mechanism is the kinematic characteristics, especially the workspace which varies with configuration parameters. A kind of 4UPS-UPU parallel mechanism is designed and its workspace is studied in this paper. First, the mobility of the 4UPS-UPU parallel mechanism is analyzed based on the reciprocal screw theory, and the motion and constraint screw systems of the parallel mechanism are obtained. Then the inverse kinematics is derived by the closed-form kinematics chain. The boundary search method in the polar coordinate system is presented to analyze the constant-orientation workspace of the parallel mechanism. Finally, the influence factors relevant to the workspace, such as the structural parameters and kinematics parameters are analyzed in detail. The relationship between the workspace volume and different parameters are obtained. The conclusions can be used for parameters optimization and path planning of the parallel mechanism.  相似文献   

16.
分析了系统资源参数对ORACLE8i数据库并行执行性能所带来的影响以及ORACLE内存参数和并行执行性能提高的关系,对每一种参数如何调整有利于系统性能的提高进行了理论分析,同时给出了实践结论.提出了并行执行环境下改善ORACLE8i数据库系统性能的技术思路和方法.  相似文献   

17.
小型单相同步发电机并列控制器设计时,并列参数选择需要限制合闸后冲击电流不大于一定范围。通过建立小型单相同步发电机并列系统的场路耦合时步有限元模型,并采用ANSYS的APDL语言编制的计算软件,研究了两台单相同步发电机在不同并列参数差值下并列的暂态过程,得出在3个并列参数差值单因素及多因素作用下合闸后冲击电流的大小和变化规律,为单相同步发电机并列控制器设计提供了准确的并列条件。  相似文献   

18.
对机群环境下的DSMC并行计算问题考虑了初始数据划分、系统负载平衡和网络通信情况等因素,建立了DSMC交互式并行化系统中的性能预测模型,分析了机群系统的物理参数如何影响DSMC并行模拟计算的效率。对两个实际DSMC问题的研究结果表明,性能预测结果与实际测试结果基本吻合。说明该方法是正确有效的。  相似文献   

19.
以机器人自适应扰动控制中系统参数的辨识为模型,对逆归最小二乘辨识算法的并行计算进行了较深入的研究。结果算法的实施,提出了一种基于Intel8098单片机的多单片机结构,其中单端口写入、多端口读出的共享存贮器方案可命名微处理机间直接进行数据传输,有效地提高了数据的传输速率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号