运行和验证

操作步骤

  1. 使用PuTTY工具,以root用户登录服务器。
  2. 执行以下命令拷贝用例文件并进入测试目录。

    cp SRR742200_1.fastq.gz /path/to/TESTCASE
    cp SRR742200_2.fastq.gz /path/to/TESTCASE
    cp GCA_000001405.15_GRCh38_full_analysis_set.fna.gz /path/to/TESTCASE
    cp hg19.fa.gz /path/to/TESTCASE
    cd /path/to/TESTCASE

  3. 执行以下命令解压算例文件。

    gzip -d SRR742200_1.fastq.gz
    gzip -d SRR742200_2.fastq.gz
    gzip -d hg19.fa.gz
    gzip -d GCA_000001405.15_GRCh38_full_analysis_set.fna.gz

  4. 执行以下命令重命名为“hs38DH.fasta”文件。

    mv GCA_000001405.15_GRCh38_full_analysis_set.fna hs38DH.fasta

  5. 执行以下命令添加BWA环境变量。

    export PATH=/path/to/BWA/bwa-0.7.17:$PATH
    export PLATFORM="Illumina"
    export RG_ID="L1"
    export LIB="pt2"
    export SAMPLE=SRR742200

  6. 执行以下命令处理用例文件。

    bwa index -a bwtsw hg19.fa
    bwa mem -t 96 -o SRR742200.sam -M -R "@RG\tID:$RG_ID\tPL:$PLATFORM\tSM:$SAMPLE\tCN:$LIB" hg19.fa SRR742200_1.fastq SRR742200_2.fastq

  7. 执行以下命令使用Samtools工具转换格式并排序。

    samtools view -bS SRR742200.sam > SRR742200.bam
    samtools sort $SAMPLE.bam $SAMPLE.sort

  8. 执行以下命令运行用例。

    { time java -jar picard.jar CollectAlignmentSummaryMetrics R=hs38DH.fasta I=SRR742200.sort.bam O=output.txt; } 2>&1 |tee picard.log

    运行结束后,会在当前目录下生成“output.txt”“picard.log”文件,其中“output.txt”为结果文件,“picard.log”为运行日志。

    需要查看“picard.log”日志中的“Elapsed time”数值,单位是“minutes”,数值越少性能越优。

    输出的结果样例如图1所示。

    图1 结果样例