NextDenovo 组装基因组
阅读原文时间:2023年07月10日阅读:3

NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-100X数据更有效),可通过correct--assemble对其进行组装。组装后,每个碱基正确率为98-99.8%, 可进一步通过NextPolish进行polish。

具体详情可阅读githup即可,https://github.com/Nextomics/NextDenovo

需要如下:

  • Python (Support python 2 and 3):

  • Psutil

  • Drmaa (PBS等系统)

    wget https://github.com/Nextomics/NextDenovo/releases/download/v2.4.0/NextDenovo.tgz
    tar -vxzf NextDenovo.tgz && cd NextDenovo

    测试

    nextDenovo test_data/run.cfg

  • Step1 准备输入文件

    ls ultra-long-ont.fastq.gz > input.fofn

  • Step2 配置文件

    [General]
    job_type = local # sge, pbs
    job_prefix = nextDenovo
    task = all # all, correct, assemble ;可以进行针对性选择
    rewrite = yes # yes/no; 再次运行是否覆盖之前结果
    deltmp = yes
    parallel_jobs = 22 # tasks
    input_type = raw # raw, corrected; 输入数据是否是correct
    read_type = ont # clr, ont, hifi; 输入数据类型
    input_fofn = input.fofn # reads 文件
    workdir = HG002_NA24385_son_assemble # 输出文件

    [correct_option]
    read_cutoff = 1k
    genome_size = 3g # estimated genome size 基因组大小评估
    sort_options = -m 50g -t 30
    minimap2_options_raw = -t 8
    pa_correction = 5
    correction_options = -p 30

    [assemble_option]
    minimap2_options_cns = -t 8
    nextgraph_options = -a 1

  • Step3 运行

    nohup nextDenovo run.cfg &

  • corrected reads

    HG002_NA24385_son_assemble/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta

  • Final assembly result:

    HG002_NA24385_son_assemble/03.ctg_graph/nd.asm.fasta

后续可进行三代以及二代对纠错即可

欢迎扫码交流

参考

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器

你可能感兴趣的文章