期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李丽君金先龙李渊印李根国《上海交通大学学报》2004,38(8):1354-1357

通过有限元分析软件结构分析模块在“神威Ⅰ”超级计算机上的并行化二次开发，把商用有限元软件强大的前后处理能力与超级计算机的高性能计算能力结合起来，扩大了分析规模，提高了分析速度．算例分析验证了该研究的正确性和高效性，为大型工程计算提供了强有力的工具．相似文献

2.

面向新一代神威超级计算机的高效内存分配器

王豪杰马子轩郑立言王元炜王飞翟季冬《清华大学学报(自然科学版)》2022,(5):943-951

随着应用程序规模的增大，应用程序对计算资源的需求也日益增加，超级计算机为满足这一需求提供了良好的平台。传统的超级计算机主要面向科学计算程序，而近年来应用的多样化对超级计算机的软硬件设计提出了新要求。该文在新一代神威超级计算机上发现了在动态运行模式下内存分配的性能问题，并针对神威的体系结构特征和应用特征，设计了高效的内存分配器——SWAlloc。实验结果表明：SWAlloc可以将超大规模机器学习训练框架八卦炉的内存分配速度提升至多75 839倍；对随机生成的内存分配记录和标准测试程序集PARSEC中的内存分配记录的测试结果，验证了SWAlloc在不同应用上的通用性和高效性，可将神威超级计算机上PARSEC的内存分配效率提升至多51倍(平均提升36%)。SWAlloc已经布署于新一代神威超级计算机上，并用于SWPytorch、 SWTensorFlow等超大规模应用。相似文献

3.

“神威蓝光”千万亿次高效能计算机系统顺利通过科技部验收

下载免费PDF全文

无《山东科学》2012,25(5):10-10

9月11日上午,由科技部组织的国家"863"计划信息技术领域"高效能计算机及网格服务环境"重大项目"神威蓝光千万亿次高效能计算机系统研制"课题顺利通过专家组验收,与会专家对"神威蓝光"全国产千万亿次计算机系统的研制成功以及国家超级计算济相似文献

4.

基于Java-CORBA的机群远程调试器的设计与实现

郑启龙姚震陈国良《中国科学技术大学学报》2003,33(3):351-358

基于CORBA规范的分布式对象计算与互操作技术,因其适应复杂的异构环境,能有效实现不同软硬件平台、网络环境的集成而日益成为业界研究的热点．本文所给出的机群远程调试器的设计与实现方案,正是利用了CORBA良好的分布对象计算技术以及Java语言的平台无关性,较好地解决了因机群系统环境差异给远程调试器的设计与实现带来的诸多问题．该设计和实现方案具有较好的可移植性与可扩展性．目前该机群调试器已完成并成为“曙光3000客户端集成环境与工具——DUET”中的重要组成部分运行于国产曙光3000并行机上,同时它的另一个实现版本也已成功地移植到了国产神威机群系统上．相似文献

5.

万核级可扩展CFD软件及应用

梁贤李新亮傅德薰马延文《华中科技大学学报(自然科学版)》2011,39(Z1):67-70

介绍了超级计算机在国民生产中的作用和意义,重点展示了自主研发的可扩展大规模计算流体力学软件(CCFD)的结构及其在直接数值模拟(DNS)复杂流动问题中的应用.分析了CCFD核心计算模块CCFD-Hoam在不同构架的超级计算机中的并行加速比,结果表明在万核级并行计算规模下,CCFD-Hoam的并行效率仍可以达到80％以上,具有较强的并行加速能力.利用CCFD-Hoam,在万核级并行计算规模下,首次对RAE2822翼型绕流和强冷却壁面条件且马赫数等于8的平板绕流做了高精度DNS计算,并给出精细的湍流场结构,结果表明CCFD-Hoam适用于近翼面复杂流场的高分辨DNS计算. 相似文献

6.

“神威·太湖之光”蝉联世界超算冠军

《少儿科技》2017,(9)

<正>超级计算机,被称为"国之重器",是一个国家科技实力的重要标志之一。今年夏天,在德国法兰克福召开的ISC2017国际高性能计算大会上,新一期全球超级计算机TOP500榜单正式公布。我国超级计算机"神威·太湖之光"以每秒12.5亿亿次的峰值计算能力以及每秒9.3亿亿次的持续计算能力,斩获TOP500榜单第一名。本次夺冠相似文献

7.

我“神威·太湖之光”成世界最快超算

《少儿科技》2016,(Z2)

正它快得令人咋舌,1秒能计算10亿亿次;1分钟的计算能力,相当于72亿人同时用计算器不间断计算32年。这个"计算高手",就是我国的"神威·太湖之光"计算机系统!在最新的超级计算机TOP500榜单上,"神威·太湖之光"以近3倍于第二名的运算速度摘得桂冠。令人振奋的是, 相似文献

8.

一种基于MapReduce的频繁模式挖掘算法

叶海琴孟彩霞王意锋张爱玲《南京理工大学学报(自然科学版)》2018,(1)

为了解决Algorithm_Add算法在挖掘大数据中的频繁模式时存在的内存占有量大和运行速度慢等问题,该文在深入研究Algorithm_Add算法的基础上,提出了基于MapReduce计算模型的并行挖掘算法——MRAlgorithm_Add。算法利用MapReduce模型对新增加模式进行处理,在各个节点上求出局部频繁模式,通过合并各个节点的结果得到全局频繁模式。介绍了MRAlgorithm_Add的设计思想,分析了算法的运行性能。实验结果表明MRAlgorithm_Add算法在Hadoop集群上运行,具有较好的加速比性能和良好的可扩展性。相似文献

9.

面向水文模拟的大规模多级并行参数率定框架

《青岛大学学报(自然科学版)》2021,(3)

为了实现大尺度水文模拟中的参数率定,提出一种基于优化算法的大规模多级并行参数率定框架。首先利用MPI划分子通信域的技术,实现了多级并行处理框架,其次设计了基于对等模式的整体架构,以充分利用处理器资源,最后使用大量非阻塞式通信的方式优化了计算效率,减少了进程间等待。将该框架应用于HIMS水文模型的参数率定,试验结果表明,对等多级并行框架相对于主从并行框架具有更好的寻优效果,利用非阻塞式通信,在寻优效率上有所提升。该框架能够高效地利用大规模处理器且有效地缩短运行时间,提升了参数优化的整体效率,具有良好的扩展性。相似文献

10.

在超级计算机上进行图像处理的并行小波算法

覃俊吴仁杰《中南民族学院学报(自然科学版)》1999,18(3):26-28

分析了小波变换的并行特征,给出了一种并行小波变换算法,使用该算法在超级计算机Ｃｒａｙ－Ⅰ和Ｃｒａｙ－Ⅱ上进行了图像（５１２＊５１２）边界检测,对所得结果进行了比较,结果表明：采用并行小波算法在超级计算机上能大大提高加速比。相似文献

11.

BSP编程环境下的调试器设计及实现

刘久星孙永强《上海交通大学学报》1999,33(9):1175-1177

并行调试器对于并行程序的开发有着非常重要的意义．介绍了ＢＳＰ计算模型及ＢＳＰ编程环境下的一个并行调试器的设计和实现过程，调试器的设计利用了ＢＳＰ并行模型中的“超步”机制对并行调试器的支持和代码嵌入技术．文中设计和实现的并行调试器运行在ＵＮＩＸ平台上，并带有图形界面接口．ＢＳＰ并行调试器作为ＢＳＰ并行编程环境的一部分，将方便程序员进行并行程序的开发．相似文献

12.

基于MapReduce的大规模文本聚类并行化

武森冯小东杨杰张晓楠《北京科技大学学报》2014,(10):1411-1419

建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性. 相似文献

13.

基于深腾1800机群系统的分子动力学并行仿真研究

郭晓光郭东明康仁科《大连理工大学学报》2007,47(6):818-822

介绍了分子动力学并行仿真计算的软硬件环境,分析了现有的几种并行算法,确定采用区域分解法作为并行算法,并在此基础上提出了基于区域二次划分的分子动力学并行仿真算法.另外,阐述了原子链、原子近邻表和原子亲属表的概念,提出了基于永久序号的消息传递策略.最后,设计了分子动力学并行仿真程序,并分别在1、2、3、4台结点机上进行了实验,运行结果表明:加速比随着结点数的增加而增加,并行效率虽略有下降但都在87.5%以上,并行效率并没有随着结点数的增加有明显的降低,说明并行程序具有很好的扩展性. 相似文献

14.

多核系统上任意2序列公共元素的并行查找

蔡德霞钟诚韦兴柳林孔升《合肥工业大学学报(自然科学版)》2012,(2):172-175,246

文章依据多核系统共享二级缓存和私有一级缓存的容量,采用数据多级分块技术、数据局部性原理和循环并行优化方法,设计了多核系统上存储高效、线程级并行、扩展性好的任意2序列公共元素的并行查找算法。结果表明,该文所给算法充分发挥了多核系统的软硬件特性,获得了良好的加速比和可扩展性。相似文献

15.

要闻摘编

《甘肃科技》2002,(11)

1.联想推出实测速度超过万亿次计算机一台实测运算速度达到每秒万亿次以上的超级计算机 ,今天在北京中关村诞生。此台由联想集团推出的、具有自主知识产权核心技术的超级计算机 ,运算速度可达每秒 1.0 2 7万亿次 ,达到目前公布的世界前 5 0 0名超级计算机排行榜中的第 2 4位的水平 ,前 2 3位的计算机均为日本和美国制造。据联想总裁杨元庆介绍 ,9月初联想万亿次计算机将作为国家“973”重大项目“大规模科学计算研究”的重要装备 ,安装在中国科学院数学与系统科学研究院 ,用于计算流体力学、石油地震资料处理、油藏模拟、气候模式计算、材料科学计算、DNA与蛋白计算等。杨元庆举例说 ,用高分辨率大气环流模式模拟全球一天的气候变化 ,在某些大型计算机上需要运行 2 0小时 ,而联想万亿次机只需两分钟。再如 ,模拟某油田区域的剩余储油量几十年的变化规律 ,用现有大型机要算好几天 ,而用 1/ 4规模的联想万亿次计算机只要 4小时。联想超级计算机的诞生标志着国内大型 IT企业开始进入高性能计算领域的研究开发 ,对我国高性能研发工作的产品化、工程化具有重要意义 ,也将为我国高性能计算及其相关的基础科学研究带来更大、更宽广... 相似文献

16.

MPP上的并行松弛迭代算法

陈妹陈云霞殷新春周解《中国科学技术大学学报》2002,32(6):732-737

讨论了松驰迭代算法在大规模并行处理机（massively parallel processor，MPP）计算模型上的并行化，给出了在MPP上的并行算法。该算法将计算近似解向量各分量值的时间错开，从而使各个分量的迭代计算可并行进行。对算法性能进行的分析和在大规模并行处理机系统曙光2000中对算法进行的计算均表明：并行松驰迭代算法具有较好的收敛速度、较高的加速比和可扩放性。相似文献

17.

技术

《特区科技》2003,(12)

“深超”超级计算机速度全国大学居首由深圳大学和清华大学共同开发的15000亿次/秒的超级计算机“深超-21C”近日在京通过科技成果鉴定,“深超-21C”将安置在深圳大学内,对外开放使用。据介绍,“深超-21C”是机群式的超级计算机结构,由128个计算结点组成的双CPU的SMP服务器,总共有256个CPU参加计算,其峰值速度达15000亿次/秒,其计算速度在全国所有大学中居首位。按照国际上超级计算机前500名排行榜来看,目前,排在第78名,超过俄罗斯排行最前的超级计算机(第95名)和台湾地区排行最前的超级计算机(第93名)。相似文献

18.

面向流体机械仿真的层次化并行计算模型

肖兮刘闯何锋张琼张兴军董小社《西安交通大学学报》2019,(2)

随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真的层次化并行计算模型(HP2H)。HP2H模型充分考虑流体机械的多层几何结构以及高性能计算机的多层逻辑架构,深入挖掘计算平台、计算模型以及物理模型的并行性,实现从物理模型到计算资源的高效任务映射。依据具体的轴流压气机转子数值模拟的实际应用背景,结合粗粒度并行和细粒度并行对模型进行实现。对HP2H计算模型进行了功能测试和性能测试,当计算核心从36核提升到432核时,计算性能提升约12倍,并行效率达到了100%。实验结果表明,HP2H计算模型不但在正确地对流体机械进行数值模拟的前提下实现了较好的计算性能,并且由于HP2H计算模型结合了粗粒度并行与细粒度并行,因而可以在不同的计算平台上运行,还可以便捷地实现计算规模的扩展,具有良好的可移植性与可扩展性。相似文献

19.

三维双曲型方程初边值问题的块三对角可扩展并行求解算法

张衡张武苏变萍《石河子大学学报(自然科学版)》2009,27(6):785-788

对三维双曲型方程带Dirichlet边界条件初边值问题的离散系统用块三对角可扩展并行算法求解，提出了保证精度和最优并行效率的分治策略。使用此方法在上海大学超级计算机“自强3000”上进行了数值实验，实验的结果与理论分析一致；在保证精度的前提下，得到线性加速比，并行效率达到90％以上。相似文献

20.

计算机超级无止境

白玉林《科学世界》2010,(5):48-52

当今世界上的许多超级计算机，都运行在大学或研究所中，它们被称为“狂热追求运算处理速度的怪物”。超级计算机，目前已经广泛应用于建筑物的耐震实验、对众星云集的星系的研究等，从最前沿的科学探索到我们身边日用品的设计，超级计算机的发明与应用，推动了许多领域的技术进步。超级计算机的结构和研究现状如何？它们的运算速度指标为何如此重要？相似文献