Please wait a minute...
图/表 详细信息
AI辅助识别的鸟类被动声学监测在城市湿地公园中的应用
白皓天, 余上, 潘新园, 凌嘉乐, 吴娟, 谢恺琪, 刘阳, 陈学业
生物多样性    2024, 32 (8): 24188-.   DOI: 10.17520/biods.2024188
摘要   (813 HTML44 PDF(pc) (1577KB)(469)  

为了探究基于AI识别的鸟类被动声学监测手段在城市湿地公园中的应用效果, 同时对比其与传统人工样线调查结果的差别, 本研究于2023年3-5月在广州市湾咀头湿地公园开展了为期3个月的同期监测。样线法为每月调查两次; 声学监测法通过安装两台声纹监测仪, 全天开启触发录制模式, 通过4G网络回传音频文件并使用以珠三角鸟类名录构建的AI识别模型进行鸟种识别, 再对结果进行置信度筛选和人工复核。样线法累计记录鸟类2,200只次; 声学监测法共采集音频96,848条, 筛选验证获得有效记录34,117条。两种方法共记录鸟类70种, 其中样线调查记录鸟类48种, 声学监测记录49种, 两种调查方法都记录到的鸟类有27种。两种调查方法重叠的物种比例不足总物种数的一半, 说明在此类湿地公园生境下这两种方法尚无法互相取代。样线调查结果相对准确、便于估算种群密度, 但对调查者的认鸟水平和工作量要求较高; 声学监测可自动化运行, 便于扩大监测规模, 但后期数据处理难度较大, 结合AI物种识别和人工校正可以提高数据处理效率。综上, 基于机器学习的AI识别技术的鸟类被动声学监测方法大大提高了数据处理效率, 但仍需要结合传统的样线调查方法, 两者结合将有更高的准确率和更广阔的应用前景。


声景指数 Acoustic indices 计算公式 Formula 说明 Explanation 参考文献 Reference
声学多样性指数 Acoustic diversity index (ADI) $ADI=\underset{i=1}{\overset{S}{\mathop \sum }}\,{{P}_{i}}\ln {{P}_{i}}$ Pi为第i个频段内信号强度高于阈值-50 dB的信号比例, S为频段数量 Pi is the proportion of signals in the i-th band with signal strength above the threshold -50 dB, S is the number of bands Villanueva-Rivera et al, 2011
声熵指数 Acoustic entropy index (H) H=Hf × Ht Hf为频谱熵, Ht为时间熵 Hf is spectral entropy, Ht is temporal entropy Sueur et al, 2008
归一化声景指数 Normalized difference soundscape index (NDSI) $NDSI=\frac{{{B}_{s}}-{{A}_{s}}}{{{B}_{s}}+{{A}_{s}}}$ Bs为生物声, 一般集中在2-11 kHz,; As为人工声; 一般集中在1-2 kHz Bs is biophony, generally concentrated in 2-11 kHz; As is anthropophony; generally concentrated in 1-2 kHz Kasten et al, 2012
生物声学指数 Bioacoustic index (BI) $BI=\underset{i=1}{\overset{t}{\mathop \sum }}\,\left( {{S}_{i}}-{{S}_{\min }} \right)\times \Delta f$ Si为子带内信号强度, ∆f为子带宽度, Smin为子带内最小信号强度 Si is the signal intensity within the sub-band, ∆f is the sub-band width, and Smin is the minimum signal intensity within the sub-band Boelman et al, 2007
Jaccard相似性指数Jaccard similarity index (J) $J=\frac{\left| A\bigcap B \right|}{\left| A\bigcup B \right|}$ A为样线调查物种集合, B为声学调查物种集合 A is the transect survey species set, B is the acoustic monitoring species set Chung et al, 2019
Sørensen相似性指数Sørensen similarity index (D) $D=\frac{2\cdot \left| A\bigcap B \right|}{\left| A \right|+\left| B \right|}$ A为样线调查物种集合, B为声学调查物种集合 A is the transect survey species set, B is the acoustic monitoring species set Engen et al, 2011
View table in article
表1 声景指数及相似性指数计算方法
正文中引用本图/表的段落
收集数据汇总后进行以下几方面数据分析: (1)统计样线调查数据的物种组成和数量。(2)将声学监测获取的鸣声使用AI识别模型进行识别分析, 根据置信度分布选取合适的置信度阈值; 筛选阈值以上的鸟鸣数据进行人工核验, 得到声学监测结果。(3)声学监测数量特征采用两种统计方式: 鸣声数和独立事件数。鸣声数以符合阈值要求的鸣声条数直接计数; 独立事件数是将每个小时划分为12个5 min的时段, 若某种鸟在此5 min时段内有符合阈值的鸣声, 则记录1次独立事件, 5 min内有多条鸣声的也只记录为1次独立事件。(4)以鸣声数和独立事件数两种方式统计声学监测结果的日活动节律和季节变化。(5)在诸多声学指数中选取具有代表性的声学多样性指数(acoustic diversity index, ADI)衡量鸟声音量分布的均匀程度, 选取声熵指数(acoustic entropy index, H)衡量鸟声相邻频段/时段音量的变化程度, 选取归一化声景指数(normalized difference soundscape index, NDSI)和生物声学指数(bioacoustic index, BI)衡量不同频段的音量分布(表1), 分析其与物种多样性的关系。(6)统计两种监测方式的共有和各自独有的物种数, 并计算Jaccard相似性指数(J)和S?rensen相似性指数(D)以衡量两种方式采集物种的相似程度(表1)。比较样线调查与声学监测的物种组成、记录数量等。
本文的其它图/表