生物多样性

• •    下一篇

基于Nextflow构建的宏条形码自动化分析流程EPPS(基因组多样性专刊)

李诣远1,David C. Molik1,Michael E. Pfrender1   

  1. 1. Department of Biological Sciences, University of Notre Dame, Notre Dame, IN, USA
  • 收稿日期:2018-08-01 修回日期:2019-02-16 出版日期:2019-06-06
  • 通讯作者: 李诣远

EPPS, a metabarcoding bioinformatics pipeline using Nextflow

Yiyuan Li1,David CMolik1,Michael EPfrender1   

  1. 1. Department of Biological Sciences, University of Notre Dame, Notre Dame, IN, USA
  • Received:2018-08-01 Revised:2019-02-16 Online:2019-06-06
  • Contact: Yiyuan Li

基于宏条形码技术的生物多样性快速检测,有助于生物多样性评估、预测和保护生物多样性。本文介绍了常用宏条形码分析的步骤和参数设定方法。我们利用Nextflow搭建了一款宏条形码分析流程,自动化的从原始数据的质量控制到环境多样性的比较。Nextflow软件还自带了流程监控的功能,可视化的输出每个进程所消耗的时间与内存。本文还使用测试数据和已发表数据证明该平台能够有效的分析宏条形码数据并可靠的分析环境生物多样性的相似性。证明了该流程可以可靠地分析宏条形码, 便于分析流程的共享。

关键词: 环境DNA, USEARCH, Trimmomatic, 主成分分析

Metabarcoding helps to quickly assess biodiversity. In this study, we discuss popular metabarcoding analytical tools and parameter settings. We also develop a metabarcoding bioinformatics pipeline, EPPS, to process data from quality control of raw reads to biodiversity comparisons between samples using a pipeline building program, Nextflow. EPPS pipeline can also summarize the time and memory costs of each process in the pipeline. We also apply the pipeline on test data and a public data set from a previous study. The result suggests that this pipeline can reliably analyze metabarcoding data and facilitate pipeline sharing of metabarcoding studies.

Key words: environmental DNA, USEARCH, Trimmomatic, PCA analysis

[1] 徐承香, 李子忠, 黎道洪. 贵州织金洞洞穴动物群落多样性与光照强度及土壤重金属含量的关系[J]. 生物多样性, 2013, 21(1): 62-70.
[2] 王玉, 高光彩, 付必谦, 吴专. 北京野鸭湖湿地地表甲虫群落组成与空间分布格局[J]. 生物多样性, 2009, 17(1): 30-42.
[3] 周志强, 魏晓雪, 刘彤. 新疆奇台荒漠植物群落的数量分类及土壤环境解释[J]. 生物多样性, 2007, 15(3): 264-270.
[4] 金伟栋, 洪德林. 太湖流域粳稻地方品种遗传多样性研究[J]. 生物多样性, 2006, 14(6): 479-487.
[5] 王正寰, 王小明. 资源选择函数拟合藏狐洞穴生境利用特征的有效性分析[J]. 生物多样性, 2006, 14(5): 382-391.
[6] 吴陆生, 吴孝兵, 江红星, 王朝林. 野生扬子鳄生境特征分析[J]. 生物多样性, 2005, 13(2): 156-161.
[7] 龚志莲, 郭辉军, 盛才余, 周开元. 西双版纳社区旱稻品种多样性与就地保护初探[J]. 生物多样性, 2004, 12(4): 427-434.
[8] 吴海荣, 强胜. 南京市秋季外来杂草定量调查研究[J]. 生物多样性, 2003, 11(5): 432-438.
[9] 张文辉, 王延平, 刘国彬. 独叶草构件生长及其与环境的关系[J]. 生物多样性, 2003, 11(2): 132-140.
[10] 李欣海, 马志军, 李典谟, 丁长青, 翟天庆, 路宝忠. 应用资源选择函数研究朱鹮的巢址选择[J]. 生物多样性, 2001, 09(4): 352-358.
[11] 刘志斌, 郑哲民, 王青川. 东亚飞蝗与亚洲飞蝗的主成分及判别式分析*[J]. 生物多样性, 1997, 05(1): 67-71.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 丁葆祖 杨淑华 吴逸 杨静仪. 环腺苷酸(C—AMP) 对人参培养细胞生长的影响[J]. 植物学报, 1984, 2(23): 74 -75 .
[2] 王文杰;关宇;祖元刚*;廖文波;张衷华;陈华峰;贺海升. 薇甘菊叶片对光反射、透射和利用效率及其与同群落植物之比较研究[J]. 植物学报, 2008, 25(06): 638 -647 .
[3] 龚明 丁念诚 刘友良. 用露点法和湿度法测定叶片水势及其组分[J]. 植物学报, 1989, 6(03): 182 -187 .
[4] 李人圭 管和. 花椰菜外植体诱导成植株[J]. 植物学报, 1984, 2(01): 42 -44 .
[5] 罗丽霞 程萍. 剥粒菠萝组织培养及快速繁殖的研究[J]. 植物学报, 2002, 19(02): 231 -233 .
[6] 施和平. 植物中的硒及其生理作用[J]. 植物学报, 1995, 12(增刊): 31 -36 .
[7] 李新鹏 童依平. 植物吸收转运无机氮的生理及分子机制[J]. 植物学报, 2007, 24(06): 714 -725 .
[8] 柯善强 桂耀林 郭仲琛. 植物人工种子的研究[J]. 植物学报, 1989, 6(04): 205 -210 .
[9] 唐宏亮 贺学礼. 中国岩黄耆属(豆科)种皮纹饰及其系统学意义[J]. 植物学报, 2007, 24(05): 614 -619 .
[10] 李久蒂 孙 捷 匡柏健 陈仲新. 沙竹中内生固氮菌的分离及鉴定[J]. 植物学报, 1997, 14(01): 52 .