运行和验证
- 使用PuTTY工具,以root用户登录服务器。
- 执行以下命令安装JAVA 1.8.0版本。
yum install java-1.8.0-openjdk* gnuplot -y
yum源为CentOS7.6镜像本地源,可自行根据需要在“/etc/yum.repos.d”路径下修改文件配置。
- 执行以下命令获取算例文件。
curl -L -o oxford.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq
此处需要服务器连接外网,需要在一台可以连接外网的服务器上下载和转换算例,然后再copy到对应的测试目录。
- 执行以下命令运行CANU。
{ time canu -p ecoli -d ecoli-pacbio genomeSize=4.8m corPartitions=384 corMemory=3 corPartitionMin=1000 corThreads=1 useGrid=false obtovlThreads=96 obtOvlHashBlockLength=682496000 utgOvlHashBlockLength=682496000 utgovlThreads=96 gridEngineMemoryOption="-l vf=MEMORY" -nanopore-raw oxford.fastq ; } 2>&1 |tee -a canu.log
命令参数说明如表1所示。
表1 canu命令参数说明 参数
说明
useGrid
是否在Grid Control下运行,默认为true,需要调整为false。
-p
assembly-prefix部件索引,根据算例定义。
-d
assembly-directory部件目录,可自定义。
genmoeSize
基因组大小,根据算例定义。
-nanopore-raw
根据实际算例去选择对应的基因文件格式。
corPartitions
任务数,尽量设置为core数量的倍数,建议设置为4倍。
corThreads
每个进程数的线程数,建议设置为1。
obtovlThreads
运行obtovl时的线程数,建议设置为核数。
utgovlThreads
运行utgov时的线程数,建议设置为核数。