|
|
||
|
基于GenBank数据库的真核生物遗传数据时空格局分析
生物多样性
2025, 33 (8):
25184-.
DOI: 10.17520/biods.2025184
遗传数据在生物多样性研究和保护实践中发挥着越来越重要的作用, 然而研究者应用这些数据时常面临数据质量缺陷、地理或类群分布不均等方面的制约, 尽管陆生脊椎动物的遗传数据格局已有较深入研究, 但全球植物、真菌和其他动物类群的遗传数据空间分布模式仍缺乏系统的实证研究。本文采用多尺度分析方法, 系统评估了动物、植物和真菌三大真核生物界的遗传数据现状、元数据完整性以及遗传数据的时空动态趋势。结果表明, 动物界拥有约2.7亿条序列和1.6万个基因组数据, 超过植物界(约1.4亿条, 0.7万个)和真菌界(约0.2亿条, 1.7万个)。遗传数据的地理元数据缺失现象普遍存在, 其中真菌ITS序列的经纬度缺失最为严重(缺失率92.07%), 其次是植物rbcL (83.19%)和动物COI (26.40%)。时空分布格局显示, 全球尺度上遗传数据呈现明显的“北半球中心化”特征, 北美、西欧和东亚地区占据主导地位, 而南半球普遍数据匮乏; 同时观察到动物COI和植物rbcL数据呈下降趋势, 而真菌ITS数据快速增长。中国区域则表现出独特的“南动物、东植物、北真菌”分布格局, 而西北地区数据积累明显不足; 时间维度上, 中国植物和真菌数据持续增长, 而动物数据保持稳定。这些发现揭示了遗传数据质量缺陷和分布失衡已成为制约生物多样性研究的重要瓶颈。为此, 我们建议建立严格的元数据存档标准, 重点加强南半球和中国西北部等数据薄弱区域的科研投入, 并通过构建国际科研合作网络促进全球数据资源的均衡配置, 从而提升遗传数据在生物多样性研究和保护实践中的应用价值。 ![]() View image in article
图2
动物界(A、B)、植物界(C、D)和真菌界(E、F)代表序列中国时空分布格局。左列(A、C、E)展示中国区域动物界(COI)、植物界(rbcL)和真菌界(ITS)序列的空间分布格局, 基于2° × 2°网格系统, 颜色梯度表示采用自然断点法划分的6个序列密度等级; 右列(B、D、F)展示中国区域动物界(COI)、植物界(rbcL)和真菌界(ITS)序列的年际变化趋势, 通过一般线性模型计算各网格内序列数量与年份的相关系数(正值表示增长趋势, 负值表示下降趋势), 黑色边框表示相关系数达到显著(P < 0.05)的网格。
正文中引用本图/表的段落
中国真核生物遗传数据的时空格局也呈现出明显的地理偏倚(图2)。在空间分布方面, 动物COI数据主要集中在东南沿海和西南地区, 其中云南西部网格贡献了8.93%的数据量, 广东南部网格占8.89%, 海南占3.91% (图2A)。植物rbcL数据则主要分布在浙江(7.61%)和广东(6.17%) (图2C)。值得注意的是, 真菌ITS数据在内蒙古呈现高度聚集, 单网格占比达19.49% (图2E)。时间动态分析结果显示: 动物COI数据研究保持稳定, 63.45%的网格呈正相关但无显著变化趋势(图2B); 植物rbcL研究普遍增加, 79.38%的网格呈正相关, 其中4个网格呈显著正相关(图2D); 真菌ITS研究增长最为明显, 91.35%的网格呈正相关, 其中9个网格呈显著正相关(图2F)。
中国尺度上, 遗传数据形成了独特的“南动物、东植物、北真菌”分布特征(图2)。云南西部和广东南部作为动物COI数据分布的核心区域(合计占比17.82%), 体现了中国西南和华南地区丰富的动物多样性资源与研究基础; 植物rbcL数据在浙江省和广东省的高度集中(合计占比13.78%)反映了东部沿海地区在植物学研究上的传统优势; 真菌ITS数据显示内蒙古样本异常集中(占19.49%)。在时间动态方面, 动物COI研究保持稳定, 而植物rbcL和真菌ITS研究显著增强, 反映了我国在植物资源保护和真菌生物技术领域的投入增加, 而动物研究的区域性稳定可能受限于传统分类学研究的瓶颈(图2)。这些时空分布特征既反映了科研资源配置的区域差异, 也揭示了数据采集的系统性偏差。值得注意的是, 此类地理偏倚和数据缺失可能产生双重负面影响: 一方面导致我们对南半球和热带生物多样性热点区域的遗传多样性认知不足; 另一方面, 数据标注不规范引发的坐标偏差可能进一步扭曲物种分布模型(Boria et al, 2014), 从而误导保护优先区的规划决策。为减少这些偏差, 未来研究需要推动全球科研资源的均衡分配, 通过国际合作项目支持数据匮乏区域的采样和测序工作, 并严格规范元数据上传标准, 确保遗传数据关联样本原始采集地坐标; 同时应整合环境DNA和公民科学(如iNaturalist数据库)等新兴技术来扩大监测覆盖范围, 此外, 我国自主研发的GenBase数据库(
本文的其它图/表
|