鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

故障排除

1. 如何在没有网络的环境或者网速很慢的环境下,使用贾维斯完成软件安装部署?

  1. 寻找一台有外网链接的服务器环境A。
  2. 在有外网的服务器环境A上下载贾维斯智能助手(HPCRunner)
  3. 将已下载好的HPCRunner软件包上传到目标服务器(以/home为例)并解压。

    cd /home

    unzip hpcrunner-master.zip

  4. 在有外网的服务器环境A上下载软件要求中的软件。
  5. 将已下载好的软件上传到目标服务器HPCRunner的downloads目录,按照软件重命名列对安装包重新命名。

    以root用户登录到目标服务器并切换到HPCRunner所在目录(以/home为例)

    ll /home/hpcrunner-master/downloads

    回显结果如下示例:

  6. 将下载好的安装包放到离线服务器hpcrunner的downloads目录。
  7. 软件安装让参见使用HPCRunner一键安装NCL

2. 执行“singularity build”出现“certificate signed by unknown authority”错误。

原因是需要验证证书。可通过忽略证书验证(不推荐用于生产环境),执行如下命令:

export SINGULARITY_NOHTTPS=1

3. 执行测试出现“ERROR: The certificate of”错误。

原因是下载算例数据需要ssl证书校验;可通过wget命令后添加--no-ch参数跳过校验

4. 执行singularity build”出现“failed to read /etc/resolv.conf: open /etc/resolv.conf: no such file or directory”错误。

原因是宿主机/etc/resolv.conf文件不存在。可通过执行如下命令解决:

touch /etc/resolv.conf

chmod 644 /etc/resolv.conf

5. 执行“singularity build”出现“FATAL: While performing build: conveyor failed to get ... Digest did not match”错误。

在构建Singularity镜像时,若遇到校验和不匹配的错误,通常是因为镜像文件在传输过程中因网络不稳定或干扰而被篡改或丢失。

为解决此问题,建议按照以下步骤操作。

  1. 清理缓存文件。默认情况下,缓存路径为~/.singularity/cache。请执行以下命令清理缓存:

    rm -rf ~/.singularity/cache

    如果缓存目录位于其他位置,请根据实际情况调整路径。

  2. 清理完成后,可以重新执行“singularity build”命令以尝试构建镜像。