鸟声标注技术及其在被动声学监测中的应用
郭倩茸, 段淑斐, 谢捷, 董雪燕, 肖治术
生物多样性
2024, 32 ( 10):
24313-.
DOI: 10.17520/biods.2024313
鸟声标注用于标记声音中的鸟类信息, 如种类、声音结构等, 是鸟类被动声学监测及相关声学数据分析、物种自动识别分类的重要基础。本文以鸟声标注为重点, 比较了人工标注、自动标注和半自动标注等常用方法的优势, 点明了各自在数据质量、标注一致性和标注效率等方面面临的挑战, 同时探讨了这些标注方法在被动声学监测中的应用进展, 提出了自动标注模型优化、跨地区数据集建立和半自动标注系统完善等未来发展方向。尽管目前自动标注方法取得了显著进展, 但鸟声标注仍面临冷启动问题, 亟需更大规模的跨地区数据集和高效的质量检测半自动标注系统, 以满足标注数量和质量的双重要求。本综述有助于帮助鸟声数据集创建者和标注者更好地理解现有标注技术及其潜在的发展趋势, 为大规模鸟类声学监测数据的高效物种自动识别提供技术支撑。
数据集类型 Dataset type | 优点 Advantage | 缺点 Disadvantage | 网站收集的数据集 Datasets collected on the website | 扩大数据集, 研究个体的行为模式和活动范围、追踪物种的迁徙路径、监测不同物种的分布变化和评估地区的物种多样性 To expand datatsets, study individual behavioural patterns and ranges, track species migration pathways, monitor changes in the distribution of different species, and assess species diversity in an area | (1)数据收集主要集中在参与者密集的地区, 缺乏某些区域或鸟类的样本, 导致数据集在地理分布上的偏差 (1) Data collection is mainly focused on areas with a high concentration of participants, and there is a lack of samples for certain areas or birds, resulting in a bias in the geographical distribution of the dataset (2)数据采集依赖于公众, 参与者的专业水平参差不齐, 导致录音质量和准确性不一致 (2) Data collection relied on the public, and the level of expertise of participants varied, resulting in inconsistent recording quality and accuracy | 博物馆收集的数据集 Datasets collected by museums | 数据集质量高, 有助于深入研究物种的生理和行为特征、精准识别物种和对比不同时期的物种分布和种群变化等 The high-quality datasets collected are useful for in-depth study of the physiological and behavioral characteristics of species, accurate identification of species, and comparison of species distribution and population changes over time | 更新频率较低, 无法及时反映当前鸟类种群的变化和动态 The datasets are updated infrequently and do not reflect the changes and dynamics of current bird populations in a timely manner | 鸟类挑战赛公开数据集 Public datasets of bird challenge | 数据集质量高、标签完备、应用于小区域的特定物种监测和保护研究 The datasets are high-quality, well-labeled, and can be used for species-specific monitoring and conservation research in small areas | 集中于特定地理区域或物种研究, 导致数据集的代表性不足, 标签缺乏迁移性 The datasets focus on specific geographic regions or species studies, resulting in under-representation of the datasets and a lack of transferability of labels | 自建数据集 Self-managed datasets | 及时反映当前物种种群动态和变化, 补充未被广泛覆盖的小区域数据 The datasets reflect the current population dynamics and changes of species timely, and supplement the data of small regions that are not widely covered | 难以覆盖广泛的地理区域和多样的鸟类种类 The datasets are difficult to cover a wide geographical area and diverse bird species |
View table in article
表1
不同类型鸟声数据集的比较
正文中引用本图/表的段落
生物声学监测网络常用于收集鸟声数据集。鸟类的整体发声系统由气流、神经控制和腔室的共鸣系统构成, 气管的长短、粗细等差异都会导致发声差异(耿慧等, 2005)。因此, 即使是相同的鸟类在不同的情境下也可能表现出多样化的叫声结构。研究人员要确保数据集不仅包含丰富的录音样本, 还应涵盖多种鸟类的不同叫声。可以使用自建数据集进行模型训练, 也要结合公开数据集, 以增强模型的特征泛化能力和鲁棒性。附录1总结了常用鸟声数据集, 这些数据集提供了丰富的鸟类录音样本, 有助于研究人员更全面地训练和评估其模型。
尽管鸟声数据集不断发展和完善, 为科研人员提供了丰富的数据支持, 但仍存在一定的局限性。表1详细介绍了不同鸟声数据集的优缺点及应用场景。例如网站收集的鸟声数据集缺乏某些区域或鸟类的样本, 录音质量和准确性也存在不一致。博物馆的鸟类数据集更新频率较低, 鸟类挑战赛公开的数据集代表性不足, 且由于不同竞赛项目提供的标签存在差异, 难以适用于其他研究。而自建鸟类数据集难以覆盖广泛区域和多样鸟类。
本文的其它图/表
|