首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
刘鑫  郭猛 《科技资讯》2014,(26):15-16
海洋数值模拟有计算密集、IO读写量大、并行扩展性良好的特点,对大规模并行计算有强烈的需求。国家超级计算济南中心的“神威蓝光”超级计算机是第一台全国产的千万亿次超级计算机,在CPU、文件系统、操作系统、编译环境各方面实现了全部国产化。本文主要介绍大气、海洋模式MITgcm在“神威蓝光”上大规模并行的运行情况和加速评测。其结果表明MITgcm在全国产的运行环境下具有良好的扩展性和并行效率,也对“神威蓝光”上的其他应用提供了可借鉴的经验。  相似文献   

2.
Windows多任务系统应用程序设计中,内存管理是一项关键技术.论述了为降低应用程序占用内存量和占有时间及应注意应用程序设计中内存组织形式的选择,以减少或限制不必要的内存对象.并使用可移动对象,合理管理内存以防止GP故障的产生.  相似文献   

3.
正它快得令人咋舌,1秒能计算10亿亿次;1分钟的计算能力,相当于72亿人同时用计算器不间断计算32年。这个"计算高手",就是我国的"神威·太湖之光"计算机系统!在最新的超级计算机TOP500榜单上,"神威·太湖之光"以近3倍于第二名的运算速度摘得桂冠。令人振奋的是,  相似文献   

4.
针对虚拟机内存需求预测困难及内存分配不足时性能严重下降的问题, 提出在虚拟机监视器中加入一个缓存 HECache。HECache 预先保留部分内存, 运行在同一台物理主机上的所有虚拟机共享该部分内存, 且对 HECache中内存的使用申请都可以立即得到满足。通过预先牺牲少量内存的方法, 所有的虚拟机都获得了更多的可用内存。实验结果表明, 将内存保留在 HECache 中与直接分配给虚拟机相比开销很低。HECache 对应用程序透明, 与现有的其他内存机制( 例如 ballooning, page-sharing, hotplug) 等兼容。  相似文献   

5.
有限元软件结构分析模块的并行开发及应用   总被引:1,自引:0,他引:1  
通过有限元分析软件结构分析模块在“神威Ⅰ”超级计算机上的并行化二次开发,把商用有限元软件强大的前后处理能力与超级计算机的高性能计算能力结合起来,扩大了分析规模,提高了分析速度.算例分析验证了该研究的正确性和高效性,为大型工程计算提供了强有力的工具.  相似文献   

6.
面向结构体数据布局优化的内存池由于自身的使用特点,在传统的内存管理方式下,扩展内存需要移动数据,代价很高。为了避免移动数据,提高内存池性能,该文设计实现了基于共享内存地址映射技术的零数据移动内存管理系统DM3,辅助内存池管理内存。DM3利用POSIX标准编程接口提供的共享内存机制,在用户层操控物理内存到程序虚地址空间的映射,实现高效内存管理。首先,DM3针对结构体数据布局优化的内存使用特点,选择特定地址空间分配,既照顾到内存池扩展需求,又避免影响程序中其他内存请求。其次,在已分配的地址空间不能满足进一步扩展需求时,DM3通过内存地址重映射,实现地址空间转移而避免实际移动数据。通过在多个操作系统上的实验比较了DM3和传统的realloc方式,结果表明:DM3系统性能优越,最高可获得9.76倍加速比。DM3使用POSIX标准实现,具有跨平台移植性和易用性。应用DM3管理内存有效地增加了内存池性能。  相似文献   

7.
对虚拟服务器资源利用率不高的问题进行梳理和分析,得出主要原因是服务器资源的申请与审核不科学、系统的运行时段不明确及资源需求差异不明确等,进而从规范服务器资源审核与分配流程、动态调整业务系统运行时段、动态调整资源配置、采用Kubernetes部署应用程序等方面提出解决方案。实践表明,对资源进行调整优化后,CPU利用率、内存利用率、存储(硬盘)利用率均得到提升,同时还降低了运维成本。  相似文献   

8.
针对阻变存储器(RRA M)写延迟大的问题,提出一种基于写页面热度的混合内存页面管理策略,将写页面进行冷热区分,存于动态随机访问存储器(DRAM)上,减少RRAM上的写数量.在基准程序集PARSEC下对混合内存系统的性能进行测试与分析.结果表明,所提出的页面管理策略可以有效地提高系统性能.  相似文献   

9.
许多应用程序要求在西文操作系统下显示汉字。作者建议根据应用程序的要求建立内嵌式字库,可以对内存的需求减到最少,并加快显示速度;同时介绍建立内嵌式字库的工具CRCLB的主要功能及原理。  相似文献   

10.
为了满足分布式仿真系统中大量数据的存取需求,提出了基于VMIC网的内存分配算法,利用链表对VMIC板卡内存进行了动态分配和释放;实验表明:算法能为每条仿真数据准确地分配唯一存储空间,能够及时合并空闲空间以减少内存碎片,并能够有效处理内存分配和释放过程中出现的异常,从而较好地为仿真系统提供充分的数据支撑。  相似文献   

11.
面向高性能计算领域的多核、众核处理器飞速发展,为了降低并行编程的难度,提高并行计算效率,数据驱动的并行编程模型成为高性能计算领域的研究热点。AceMesh是数据流驱动的、支持多核和众核异构平台的任务并行编程模型,能自动发掘结构化网格应用中存在的数据驱动的任务图并行性。但如果任务粒度划分较细,其构图过程会造成很大开销。本研究结合"申威26010"异构众核处理器的结构特点,从主、从核通信优化、内存池、无后继任务收集等方面对AceMesh构图过程进行优化,并采用航天飞行器应用中的7个热点子程序对优化效果进行测试。测试数据表明以上优化取得5倍的加速。为验证构图优化对AceMesh整体性能的提升,对航天飞行器应用分别在Acemesh和神威OpenACC的加速效果进行了测试,优化后的AceMesh加速效果约为神威OpenACC的1.5倍。  相似文献   

12.
采用内存数据访问对象提高数据库访问速度   总被引:3,自引:0,他引:3  
将内存数据库的思想溶于传统磁盘数据库(DRDB)中,采用内存数据访问对象(MMDAO)技术,在当前主流计算机所能提供的有限内存中实现应用程序与数据库系统之间的接口,使数据库检索、存取等过程在内存中进行,避免大量的磁盘数据I/O,从而实现数据库应用程序中数据的高速存取、检索和操纵,提高应用系统的执行效率。  相似文献   

13.
利用神威OpenACC在"太湖之光"上成功移植了Silicon-Crystal应用,针对控制流驱动的OpenACC无法有效解决访存密集型应用带宽访存优化和跨时间迭代问题,通过数据流驱动的任务图并行化方法挖掘任务迭代间的并行性,利用任务间的错峰访存提高访存带宽。实验结果表明,神威OpenACC移植单核组获得2.26倍加速;时间步长为1时,任务图并行化移植后的该应用可获得2.52倍加速,性能较OpenACC提升11.5%;时间步长扩展至20时,任务图规模随之增加,任务的乱序调度使错峰访存的优势进一步扩大,整体应用达到3.2倍性能加速,性能较OpenACC提升42%。  相似文献   

14.
IntraGrid是一种松散耦合的网格计算机体系结构,其主要目标是将局域网范围内的计算资源共享,尤其是将高性能的大规模机群互联以解决超大规模的网格应用问题,使其更加有效。为了有效地利用计算资源及其运行应用程序的需要,大量的监控数据被收集。讨论了监控资源的异构性和动态性、海量监控数据的处理以及监控数据的可视化等问题。在IntraGrid环境下,设计了一种监控系统--IntraGridMon,并对其进行了性能评价。结果表明,该网格监控系统是有效、可行的。  相似文献   

15.
基于ORACLE数据库应用系统的性能参数优化,根据实践归纳并提出调整服务器内存分配、调整磁盘I/O、调整资源竞争等具体方法,进行参数调整可提高系统运行效率1-5倍。对类似的应用系统具有实用参考价值。  相似文献   

16.
根据EPC Global标准,提出了基于RFID数据特征的网格索引结构.该索引结构针对RFID应用场景设计,不仅能实现高效的插入、查询以满足实时性的需求,还能够提高内存的利用率,节省内存.与传统索引相比,提出的索引结构能够完全适用于真实的RFID应用场景,实现条件查询、范围查询等其他传统索引很难实现的操作.可以减少内存消耗,提升条件查询,范围查询的速度.实验结果证明基于RFID数据特征的网格索引不但在插入效率上不亚于传统索引,而且在条件查询,范围查询的效率远远高于其他传统索引结构,并且内存占用率也具有一定优势.  相似文献   

17.
莫建麟 《科学技术与工程》2012,12(25):6495-6497,6502
提出了一种程序踩内存的检测方法。利用内存保护技术,在应用程序申请内存后根据情况将其所申请的内存页面属性设置为只读。如果应用程序发生不当的内存访问,将极有可能踩到属性为只读的内存页面,从而引发内存访问冲突异常。提示发现程序踩内存事件并准确定位错误代码。通过进行针对性的维护操作,达到优化程序、提高软件可靠性和安全性的目的。  相似文献   

18.
多路径交通分配模型的改进及节点分配算法   总被引:9,自引:0,他引:9  
本文对动态多路径交通分配模型进行了改进,提出了该模型的快速算法-节点分配算法,并详细阐述了节点分配法中的网络处理、分配节点排序及参数确定等问题。节点分配算法的采用,大大提高了多路径交通分配方法的速度及容量,使之能在超大规模网络的交通规划、交通控制及交通诱导系统中应用。  相似文献   

19.
优化内存管理是微机应用中的现实问题,本文从微机内存分配出发,阐述了优化内存管理的方法,并给出了优化内存管理的命令实例  相似文献   

20.
为了高效、安全地利用计算机内存资源,在大型的软件设计中,往往要进行大量的内存分配与回收操作,为此,C++专门提供了malloc等相关函数进行操作,这些函数能够满足一般的使用,但由于它们调用了操作系统API,所以实际使用时会在操作系统中产生大量的内存碎片,让内存分配成为效率瓶颈,从而降低系统性能.基于此,通过对循环首次适应算法进行改进,设计并实现了基于C++的高效内存池,大幅提升了内存分配与回收的效率.同时,还为内存池编写了相关的分配子,使其能与C++标准库无缝对接,提供了若干具有垃圾回收功能的智能指针,提高了内存管理与程序运行的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号