排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库FitenBLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%. 相似文献
2.
多功能机光电旋转接头是一种用于旋转体与固定装置之间传输测试信号的机械光学电子装置.该旋转接头可以用于传送交流或直流电源,分时传输二路信号,并实现电信号的模拟/数字转换、干扰隔离等功能,解决由于在旋转体上安装传感器的同时在固定装置上安装信号处理装置而引起的两者之间相互连接电线的缠绕问题. 相似文献
3.
特高压输变电工程中,设备体积庞大,其基础一般采用混凝土浇筑,此类设备基础混凝土很多属于大体积混凝土范畴,大体积混凝土施工过程中,如何控制由于混凝土水化热导致的有害裂缝显得尤为必要,本文通过某特高压工程1000kV串补基础大体积混凝土施工温度控制为依据,论述了大体积混凝土施工方法和控制要点,对类似工程大体积混凝土施工具有一定的借鉴意义。 相似文献
4.
5.
DSP具有能效比高的特点,可以用于通用高性能计算.矩阵乘是许多科学与计算问题的核心算法,在DSP上取得高性能具有重要的理论和现实意义.面向通用DSP,提出了矩阵乘并行算法,建立了矩阵乘峰值性能模型,根据性能模型,构建了矩阵乘性能达Tflops级DSP体系结构参数配置,对通用DSP的设计参数给出了明确的性能指标要求,包括乘加流水线数量、寄存器数目、带宽和延迟. 相似文献
1