两个软件的作用:
1.samtools mpileup 主要是用于收集BAM文件中的信息,这个位点上有多少条read匹配,匹配read的碱基是什么,并将这些信息存储在BCF文件中。
2.bcftools 是真正进行calling的软件。其也可以用来BCF和VCF格式的转换。
常见流程:
#index REF
$samtools faidx GCF.fa
$bowtie2-build ./GCF.fa ./index/GCF
#生成bam比对文件
$bowtie2 -x ./index/GCF reads.fastq -S ./1.sam
$samtools view -sb 1.sam >1.bam
#对bam文件排序
$samtools sort -n 1.bam>1.sorted.bam
#mpileup收集bam信息
$samtools mpileup -gUf ./GCF.fa 1.sorted.bam -o 1.bcf
#-g,输出格式为BCF;-U ,输出格式不压缩,利于下步分析;-f,faidx后的REF
#bcftools call SNP
$bcftools view -cvNg 1.bcf>1.vcf
#-c,用贝叶斯推理进行calling;-v,只输出variant位点(force -c);-g 在variant位点,call per-sample genotypes(force -c);-N 跳过REF中不是A/T/C/G的点
#对vcf文件进行过滤
$vcfutils.pl varFilter -D100 > var.flt.vcf
#-D 设置call SNP的最大reads depth
手机扫一扫
移动阅读更方便
你可能感兴趣的文章