运行和验证
操作步骤
- 使用PuTTY工具,以root用户登录服务器。
- 执行以下命令拷贝用例文件并进入测试目录。
cp SRR742200_1.fastq.gz /path/to/TESTCASE cp SRR742200_2.fastq.gz /path/to/TESTCASE cp GCA_000001405.15_GRCh38_full_analysis_set.fna.gz /path/to/TESTCASE cp hg19.fa.gz /path/to/TESTCASE cd /path/to/TESTCASE
- 执行以下命令解压算例文件。
gzip -d SRR742200_1.fastq.gz gzip -d SRR742200_2.fastq.gz gzip -d hg19.fa.gz gzip -d GCA_000001405.15_GRCh38_full_analysis_set.fna.gz
- 执行以下命令重命名为“hs38DH.fasta”文件。
mv GCA_000001405.15_GRCh38_full_analysis_set.fna hs38DH.fasta
- 执行以下命令添加BWA环境变量。
export PATH=/path/to/BWA/bwa-0.7.17:$PATH export PLATFORM="Illumina" export RG_ID="L1" export LIB="pt2" export SAMPLE=SRR742200
- 执行以下命令处理用例文件。
bwa index -a bwtsw hg19.fa bwa mem -t 96 -o SRR742200.sam -M -R "@RG\tID:$RG_ID\tPL:$PLATFORM\tSM:$SAMPLE\tCN:$LIB" hg19.fa SRR742200_1.fastq SRR742200_2.fastq
- 执行以下命令使用Samtools工具转换格式并排序。
samtools view -bS SRR742200.sam > SRR742200.bam samtools sort $SAMPLE.bam $SAMPLE.sort
- 执行以下命令运行用例。
{ time java -jar picard.jar CollectAlignmentSummaryMetrics R=hs38DH.fasta I=SRR742200.sort.bam O=output.txt; } 2>&1 |tee picard.log
运行结束后,会在当前目录下生成“output.txt”和“picard.log”文件,其中“output.txt”为结果文件,“picard.log”为运行日志。
需要查看“picard.log”日志中的“Elapsed time”数值,单位是“minutes”,数值越少性能越优。
输出的结果样例如图1所示。