鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

鲲鹏HPC 成长地图

高性能计算(High Performance Computing,HPC)是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。

确定场景和组件

  • 了解HPC

    介绍HPC的概念和当前面临的挑战。

  • 功能架构

    介绍鲲鹏HPC的功能架构分层结构。

  • 特性清单

    鲲鹏Donau Portal、Donau Scheduler和Hyper MPI支持的特性清单。

  • 使用流程

    HPC解决方案应用组件基础环境搭建、性能测试、移植、调优的端到端流程。

集群基础环境搭建

  • 基础环境搭建指南

    介绍HPC解决方案行业应用在鲲鹏计算平台上进行软件移植前的基础环境准备。

  • GNU 9.1 安装指南

    GNU是一个开源的开发工具链,其中包括GCC编译器、汇编器、链接器等开源工具部件。提供GNU 9.1的安装指导。

  • HTCondor 8.9.2 安装指南

    HTCondor是一个开源的高吞吐量计算软件框架,用于计算密集型任务的粗粒度分布式并行化。提供HTCondor 8.9.2的安装指导。

  • Lustre 2.12.2 安装指南

    Lustre是一种并行文件系统,通常用于大型计算机集群和超级计算机。提供Lustre 2.12.2的安装指导。

  • OpenHPC 1.3.8 安装指南

    OpenHPC是一套基于Linux的HPC的社区驱动的FOSS(Free and open source software,自由及开放源代码软件)工具。提供OpenHPC 1.3.8的安装指导。

  • OpenMPI 4.0.1 安装指南

    OpenMPI是一种高性能消息传递库。提供OpenMPI 4.0.1的安装指导。

  • Slurm 18.08.7 安装指南

    Slurm是一个开源,高度可扩展的集群管理工具和作业调度系统,用于各种规模的Linux集群。提供Slurm 18.08.7的安装指导。

基础性能测试

  • IMB性能测试指导书

    IMB基准测试是MPI性能的基准测量,针对各种尺寸的消息大小以进行点对点和全局通信操作。

  • IOR测试指导书

    IOR代表“Interleaved or Random”,用于测试并行POSIX和MPI-IO级别的I/O性能。该并行程序在几组条件下对文件执行写入和读取,并报告生成的吞吐率。

  • Stream测试指导书

    Stream是业界广为流行的综合性内存带宽实际性能测量工具之一,支持Copy、Scale、Add、Triad四种操作。

行业应用移植

  • 气象

    气象行业应用移植指南,包括WRF、CAMx、CESM、NEMO和ROMS等应用。

  • 制造

    制造行业应用移植指南,包括OpenFOAM、SU2、PALABOS、deal.II和AMG等应用。

  • 教育科研

    教育科研行业应用移植指南,包括UDUNITS、GROMACS、Lammps、QUANTUM ESPRESSO和NAMD等应用。

  • 生命科学

    生命科学行业应用移植指南,包括BLAST、BWA、CNVnator、Cufflinks和GATK等应用。

  • 其他

    Hadoop、SGE、Conda、NPB和Double-conversion等应用的移植指南。

性能调优

  • 调优概述

    介绍鲲鹏处理器NUMA。

  • 硬件基线化调优

    通过配置内存、高速网卡和服务器BIOS进行调优。

  • 系统基线化调优

    通过配置OS及内核版本、调整内存页大小、解除系统资源限制和启用HugePages进行调优。

  • IO调优

    通过调整脏数据刷新策略、调整磁盘文件预读参数、优化磁盘IO调度方式、优化文件系统磁盘挂载方式和选用性能更优的文件系统XFS进行调优。

  • 基础软件调优

    通过配置编译器、数学库、MPI和OpenMP线程核绑定进行调优。

  • 应用软件调优

    通过调整并行IO和Top-Down模型分析进行调优。

  • 加速库调优

    利用鲲鹏920处理器上带有的多种硬件加速器(如加解密、压缩解压缩)进行调优。

更多资源