运行和验证

  1. 使用PuTTY工具,以root用户登录服务器。
  2. 执行以下命令安装JAVA 1.8.0版本。

    yum install java-1.8.0-openjdk* gnuplot -y

    yum源为CentOS7.6镜像本地源,可自行根据需要在“/etc/yum.repos.d”路径下修改文件配置。

  3. 执行以下命令获取算例文件。

    curl -L -o oxford.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq

    此处需要服务器连接外网,需要在一台可以连接外网的服务器上下载和转换算例,然后再copy到对应的测试目录。

  4. 执行以下命令运行CANU。

    { time canu -p ecoli -d ecoli-pacbio genomeSize=4.8m corPartitions=384 corMemory=3  corPartitionMin=1000 corThreads=1 useGrid=false obtovlThreads=96 obtOvlHashBlockLength=682496000 utgOvlHashBlockLength=682496000 utgovlThreads=96  gridEngineMemoryOption="-l vf=MEMORY" -nanopore-raw oxford.fastq ; } 2>&1 |tee -a canu.log

    命令参数说明如表1所示。

    表1 canu命令参数说明

    参数

    说明

    useGrid

    是否在Grid Control下运行,默认为true,需要调整为false。

    -p

    assembly-prefix部件索引,根据算例定义。

    -d

    assembly-directory部件目录,可自定义。

    genmoeSize

    基因组大小,根据算例定义。

    -nanopore-raw

    根据实际算例去选择对应的基因文件格式。

    corPartitions

    任务数,尽量设置为core数量的倍数,建议设置为4倍。

    corThreads

    每个进程数的线程数,建议设置为1。

    obtovlThreads

    运行obtovl时的线程数,建议设置为核数。

    utgovlThreads

    运行utgov时的线程数,建议设置为核数。