HPC集群检查可对HPC物理机或虚拟机集群各节点,进行节点间软件、硬件配置的一致性检查,并给出优化建议。
选择“通用分析”,打开新建任务页面。
创建HPC集群检查任务,如图1所示。
参数 |
说明 |
---|---|
运行mpirun节点 |
配置需要检查的mpi节点。 |
共享目录 |
配置分析共享目录。 |
采集特权指标 |
配置是否采集拥有特殊权限的数据。默认关闭,若mpirun运行用户为非特权用户,需在所有节点上进行sudo配置,以便执行特权用户才可执行的命令 |
mpirun运行用户 |
配置mpirun运行用户名。
说明:
因采集过程中所有操作将使用root用户进行,可能存在风险,建议使用普通用户。 |
密码 |
配置mpirun运行用户的密码。 |
mpirun所在路径 |
配置mpirun应用所在路径。 |
mpirun参数(可选) |
配置mpirun运行参数;参数中需明确指定任务节点(如--hostfile),仅使用-np参数将使任务随机发至节点,导致集群检查和mpi运行环境不一致,造成任务失败。 |
hostfile(可选) |
上传hostfile配置文件,仅支持文本格式且不大于10MB的文件;可下载模板参考。 |
环境变量文件(可选) |
上传环境变量文件,仅支持文本格式且不大于10MB的文件;可下载模板参考。 |
单击任务名称后面对应的图标可以执行如下操作: