故障排除
1. 如何在没有网络的环境或者网速很慢的环境下,使用贾维斯完成软件安装部署?
- 寻找一台有外网链接的服务器环境A。
- 在有外网的服务器环境A上下载贾维斯智能助手(HPCRunner)。
- 将已下载好的HPCRunner软件包上传到目标服务器(以/home为例)并解压。
cd /home
unzip hpcrunner-master.zip
- 在有外网的服务器环境A上下载软件要求中的软件。
- 将已下载好的软件上传到目标服务器HPCRunner的downloads目录,按照软件重命名列对软件包进行重新命名。
以root用户登录到目标服务器并切换到HPCRunner所在目录(以/home为例)
ll /home/hpcrunner-master/downloads
回显结果如下示例:
-rwxr-xr-x. 1 root root 126580835 Dec 10 2019 boost_1_72_0.tar.gz -rwxr-xr-x. 1 root root 3539630 Jan 19 1970 ecFlow-5.5.2-Source.tar.gz
- 软件安装。可参见使用HPCRunner一键安装ecFlow 。
2. 执行“singularity build”出现“certificate signed by unknown authority”错误。
原因是需要验证证书。可通过忽略证书验证(不推荐用于生产环境),执行如下命令:
export SINGULARITY_NOHTTPS=1
3. 执行“singularity build”出现“failed to read /etc/resolv.conf: open /etc/resolv.conf: no such file or directory”错误。
原因是宿主机/etc/resolv.conf文件不存在。可通过执行如下命令解决:
touch /etc/resolv.conf
chmod 644 /etc/resolv.conf
4. 执行“singularity build”出现“FATAL: While performing build: conveyor failed to get ... Digest did not match”错误。
在构建Singularity镜像时,若遇到校验和不匹配的错误,通常是因为镜像文件在传输过程中因网络不稳定或干扰而被篡改或丢失。
为解决此问题,建议按照以下步骤操作。
- 清理缓存文件。默认情况下,缓存路径为~/.singularity/cache。请执行以下命令清理缓存:
rm -rf ~/.singularity/cache
如果缓存目录位于其他位置,请根据实际情况调整路径。
- 清理完成后,可以重新执行“singularity build”命令以尝试构建镜像。