鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

故障排除

1. 如何在没有网络的环境或者网速很慢的环境下,使用贾维斯完成软件安装部署?

  1. 寻找一台有外网链接的服务器环境A。
  2. 在有外网的服务器环境A上下载贾维斯智能助手(HPCRunner)
  3. 将已下载好的HPCRunner软件包上传到目标服务器(以/home为例)并解压。

    cd /home

    unzip hpcrunner-master.zip

  4. 在有外网的服务器环境A上下载软件要求中的软件。
  5. 将已下载好的软件上传到目标服务器HPCRunner的downloads目录,按照软件重命名列对软件包进行重新命名。

    以root用户登录到目标服务器并切换到HPCRunner所在目录(以/home为例)

    ll /home/hpcrunner-master/downloads

    回显结果如下示例:

    -rw-r--r--. 1 root root        292 Nov 10 16:18 download.md
    -rw-r--r--. 1 root root     184817 Jul 26  2016 g2clib-1.6.0-patch.tar.gz
    -rwxr-xr-x. 1 root root    5976570 May 10  2018 grads-2.2.1-src.tar.gz
    -rw-r-----. 1 root root 2491839839 Nov 10 16:13 HPCKit_25.2.0_Linux-aarch64.tar.gz
    -rw-r--r--. 1 root root    1201847 Oct  5  2016 jasper-1.900.2.tar.gz
    -rwxr-xr-x. 1 root root    1141090 Sep 29  2017 libpng-1.5.30.tar.gz
    -rwxr-xr-x. 1 root root   57722446 Sep 30 15:22 supplibs-2.2.1.tar.gz
    -rwxr-xr-x. 1 root root    1224503 Dec 28  2020 udunits-2.2.28.tar.gz
  6. 软件安装。可参见使用HPCRunner一键安装GrADS

2. 执行“singularity build”出现“certificate signed by unknown authority”错误。

原因是需要验证证书。可通过忽略证书验证(不推荐用于生产环境),执行如下命令:

export SINGULARITY_NOHTTPS=1

3. 执行“singularity build”出现“failed to read /etc/resolv.conf: open /etc/resolv.conf: no such file or directory”错误。

原因是宿主机/etc/resolv.conf文件不存在。可通过执行如下命令解决:

touch /etc/resolv.conf

chmod 644 /etc/resolv.conf

4. 执行“singularity build”出现“FATAL: While performing build: conveyor failed to get ... Digest did not match”错误。

在构建Singularity镜像时,若遇到校验和不匹配的错误,通常是因为镜像文件在传输过程中因网络不稳定或干扰而被篡改或丢失。

为解决此问题,建议按照以下步骤操作。

  1. 清理缓存文件。默认情况下,缓存路径为~/.singularity/cache。请执行以下命令清理缓存:

    rm -rf ~/.singularity/cache

    如果缓存目录位于其他位置,请根据实际情况调整路径。

  2. 清理完成后,可以重新执行“singularity build”命令以尝试构建镜像。