|
|
||
|
基于环境DNA宏条形码的无脊椎动物多样性研究: 生物信息学流程比较与评估
生物多样性
2026, 34 (1):
25369-.
DOI: 10.17520/biods.2025369
近年来, 环境DNA (eDNA)宏条形码技术被广泛应用于生物多样性研究, 但该技术在蓬勃发展的同时仍存在一些方法学问题有待解决。其中一个重要问题是生物信息学处理流程的选择, 尤其是对物种多样性极高的无脊椎动物, 测序结果的处理流程直接影响检测结果, 但目前缺乏对该过程的系统比较评估。本研究使用来源于淡水的eDNA样品进行无脊椎动物宏条形码测序, 比较评估多种生物信息学流程对于无脊椎动物序列处理的影响。研究中选取4种常用的聚类或降噪方法(UPARSE、Swarm、UNOISE和DADA2)以及3种分类分配方法(BOLDigger、BLASTN和朴素贝叶斯分类器), 共组合形成12种生物信息学处理流程。结果显示, DADA2降噪方法与BOLDigger分类分配相结合的处理流程产生了最多的无脊椎动物分子可操作分类单元(MOTU)与最高的分类覆盖度和分类分辨率。4种聚类或降噪方法中, UNOISE和DADA2降噪方法比UPARSE和Swarm聚类方法获得了更多的无脊椎动物MOTU; 3种分类分配方法中, BOLDigger和BLASTN比朴素贝叶斯分类器获得了更高的分类覆盖度和分类分辨率。这些结果对基于eDNA的淡水无脊椎动物多样性研究具有重要的参考价值, 此外还提示针对不同研究类群以及不同条形码区段, 需要相应调整使用的生物信息学方法, 以得到更为准确可靠的生物多样性数据。 ![]() View image in article
图1
本研究12种序列数据处理流程的具体步骤和命令
正文中引用本图/表的段落
为了比较与评估生物信息学处理流程对于无脊椎动物多样性eDNA研究的影响, 我们采用无脊椎动物通用引物对多个河流和湖泊水体采集的eDNA样品进行扩增测序, 选取生物信息学流程中最常用的4种聚类或降噪方法(UPARSE、Swarm; UNOISE、DADA2)以及3种分类分配方法(BOLDigger、BLASTN、朴素贝叶斯分类器), 利用其组合而成的12种生物信息学流程进行序列处理与分类分配(图1), 通过综合比较与评估这些在无脊椎动物多样性eDNA研究中的常用处理流程, 旨在为相关研究提供生物信息方法学指导与借鉴。
对高通量测序获得的原始数据进行了12种生物信息学流程的测试, 包括4种序列聚类或降噪方法以及3种分类分配方法(图1)。
本文的其它图/表
|