samtools+bcftools 进行SNP calling
阅读原文时间:2023年07月16日阅读:2

两个软件的作用:
1.samtools mpileup 主要是用于收集BAM文件中的信息,这个位点上有多少条read匹配,匹配read的碱基是什么,并将这些信息存储在BCF文件中。
2.bcftools 是真正进行calling的软件。其也可以用来BCF和VCF格式的转换。

常见流程:

#index REF
$samtools faidx GCF.fa
$bowtie2-build ./GCF.fa ./index/GCF

#生成bam比对文件
$bowtie2 -x ./index/GCF reads.fastq -S ./1.sam
$samtools view -sb 1.sam >1.bam

#对bam文件排序
$samtools sort -n 1.bam>1.sorted.bam

#mpileup收集bam信息
$samtools mpileup -gUf ./GCF.fa 1.sorted.bam -o 1.bcf
#-g,输出格式为BCF;-U ,输出格式不压缩,利于下步分析;-f,faidx后的REF

#bcftools call SNP
$bcftools view -cvNg 1.bcf>1.vcf
#-c,用贝叶斯推理进行calling;-v,只输出variant位点(force -c);-g 在variant位点,call per-sample genotypes(force -c);-N 跳过REF中不是A/T/C/G的点

#对vcf文件进行过滤
$vcfutils.pl varFilter -D100 > var.flt.vcf
#-D 设置call SNP的最大reads depth

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器

你可能感兴趣的文章