|
|||||||||||||||||||||||||
被动声学监测设备性能比较及对鸟声识别的影响
生物多样性
2024, 32 (10):
24273-.
DOI: 10.17520/biods.2024273
被动声学监测技术能够以非侵入的方式进行长期有效的监测, 已广泛应用于鸟类的监测, 监测过程收集到的大量数据需要借助自动化识别技术进行分析处理。然而, 不同录音设备的性能差异可能会影响自动化识别软件正确识别鸟类类别的能力。本研究使用国内外6种类型录音设备对4种不同频带范围的鸟声信号进行回放录音, 选取BirdNET作为鸟类鸣声自动识别器, 对2种植被类型录音环境、5种距离和3种声源方向的回放录音信号进行鸟声识别, 评估这些变量对鸟类类别识别性能的影响。通过比较录音设备的基本参数和配置, 并构建广义线性模型(generalized linear model, GLM)对识别结果进行统计分析, 以评估不同录音设备的监测性能。结果表明,录音设备类型显著影响BirdNET对鸟类类别的识别准确率。总体上, 随着距离增加, 设备的监测有效性下降, 且在50 m或更近距离内, BirdNET的识别准确率显著更高。声源方向对识别性能也有影响, 当声源与录音设备方向相反时, 识别准确率显著下降。不同设备对4种不同频带范围鸟声信号的识别有效性存在不一致性。此外, 植被类型显著影响鸟声信号传播的衰减, 草地植被下的总体识别准确率比林地植被高40.1%。本研究建议, 在选择和部署长期录音监测设备前, 除评估成本和参数外, 还应进行实地录音监测有效性的评估。根据评估结果, 优化监测距离和方向设置, 以提升监测策略的有效性。
表1
4种鸟类鸣声信号信息
正文中引用本图/表的段落
用于回放的鸟鸣声信号含四声杜鹃(Cuculus micropterus)、长尾缝叶莺(Orthotomus sutorius)、黄胸草鹀(Ammodramus savannarum)、红翅凤头鹃(Clamator coromandus) 4种鸟类类别, 4种鸟类主要音频参数信息见表1, 图3为它们的声谱图示例。鸣声数据来源于Xeno-canto网站(www.xeno-canto.org), 每种鸟类挑选20个3 s的鸣声片段(20个鸣声片段来自多个音频文件的多只个体), 4个物种共80个鸟鸣声片段。鸟鸣声片段的选择标准是确保音频片段可以直接被BirdNET准确识别(在默认参数情况下, BirdNET可以正确识别音频片段物种类别, 并且识别结果置信度大于0.9)。将挑选好的鸟鸣声片段组合成一个回放声音文件, 并利用Adobe Audition 2021软件对80个鸣声片段信号强度近似标准化(实际峰值幅度统一为-8 dB至-9 dB), 其中每两个相邻的鸟鸣声片段之间填充3 s的静音间隔, 确保每个鸟鸣声片段可以单独分析。声音文件开始处加入3 s正弦波信号, 以便于定位录音信号中的回放信号起始时间。因此回放声音文件包含1段正弦波、80段鸟鸣声信号、3 s最大长度序列(maximum length sequence, MLS)信号, 总时长为483 s。
从本次实验结果来看, 国产设备的录音性能良好, 能应用于实际的声学监测项目。然而, 本次实验仅在较为理想的环境条件下以鸟声为例进行, 对于复杂的野外监测情况, 仍有许多因素需要进一步验证。诸如设备的携带与安装便捷性、长期稳定性、续航能力, 以及设备对温湿度、大气压变化的适应范围, 甚至对风沙和盐度的耐受性与耐用度等, 都需通过大规模实验来全面评估其实际性能表现。根据研究结果和实验部署过程从录音设备设计和部署角度提出以下建议: (1)录音设备的参数设置对监测效果至关重要, 关键参数如采样率、增益和录音日程等, 需根据具体环境和监测目标进行精准调整。为提高现场部署的便捷性, 建议通过手机蓝牙等方式实现对设备参数的远程设置与状态查询, 以及可设置音频文件为无限时长, 以满足不同时长的连续监测任务。(2)设备应具备实时故障监测功能, 在运行过程中若出现异常, 应能通过有效途径及时反馈给相关人员, 以避免因设备故障导致的长时间数据缺失, 从而保障数据采集的完整性与监测工作的连续性。(3)声学录音设备作为野生动物监测的有效工具, 除了考虑成本差异以及特殊的配置需求(多声道录音, GPS定位, 根据时间自动修改采样率等)之外, 也要关注目标物种鸣声频带范围来选择合适的录音设备。(4)在长期部署录音设备之前, 先进行实地录音环境的性能评估(Darras et al, 2018), 按照本研究中的现场实验流程以评估录音设备的有效监测距离和对声源方向变化的影响, 以此来确定最有效的录音设备部署的密度和麦克风朝向。确定实地录音环境下设备的有效监测距离之后, 研究人员可根据目标物种的潜在领地范围和录音设备有效监测距离进行规划部署。我们建议将相邻录音设备之间的距离设置为有效监测距离的3倍, 这种布局可以确保监测区域得到基本覆盖, 同时避免单一叫声被多个设备重复记录, 保证监测效果的有效性。
本文的其它图/表
|