|
||
基于机器学习鸟声识别算法研究进展
生物多样性
2023, 31 (11):
23272-.
DOI: 10.17520/biods.2023272
监测生态系统中鸟类多样性的状态和趋势是一项重大挑战, 需要广泛适用的基于机器学习的鸟鸣识别算法。为准确把握基于机器学习的鸟声识别方法的研究现状与发展趋势, 本文介绍了鸟鸣识别任务的基本概念, 并从模型结构设计角度对基于机器学习的鸟鸣识别算法进行概述。鉴于基于机器学习的鸟鸣识别技术的跨学科性质, 根据研究方向将算法分为: 概率模型(probabilistic model)、模板匹配(template matching)、时序分析(time series analysis)、迁移学习(transfer learning)、数据融合(data fusion)、集成学习(ensemble learning)、度量学习(metric learning)和无监督聚类(unsupervised clustering)的鸟鸣识别算法。本文回顾了这些方法在完成鸟声识别任务时的技术脉络, 以及这些算法的特点和局限性, 并比较了它们在鸟鸣识别方面的有效性。本文还讨论了常用的标准化鸟声开源数据集和评估指标。最后, 本文指出当前方法所面临的挑战和该领域潜在的未来研究方向。本综述旨在为从事鸟声识别研究的学者和开发人员提供一个全面的参考框架, 以便更好地理解现有技术和潜在发展趋势。 ![]() View image in article
图10
监督学习与不完全监督学习的区别
正文中引用本图/表的段落
上一节阐明了度量学习策略如何处理部分未标注的数据集样本, 然而, 利用数据的内在关系将鸟声样本进行分类的方法(Ntalampiras & Potamitis, 2021)正是无监督聚类的方法。无监督聚类的识别在某种程度上与2.2.5节的三元组损失相类似, 但它们的核心差异在于前者着重于同一鸟种样本间的相似性, 而后者则着重于强调不同鸟种样本之间的差异性。图10展示了监督学习、半监督学习和无监督聚类的主要区别。
(3) Macaulay资料库(
本文概述了基于机器学习的鸟声识别方法, 比较了当前先进识别方法之间的优劣, 并对这些方法的性能进行了分析.尽管目前基于深度学习的鸟声识别方法取得了一定的成绩, 但面向大规模数据样本时, 其准确性和鲁棒性还需要进一步提高, 推广应用仍面临以下挑战: ... Probability enhanced entropy (PEE) novel feature for improved bird sound classification 1 2022 ... 为确保识别的精度和鲁棒性, 手工特征的有效性一直被视为一个关键指标.某些认知科学的研究显示, 多频带谱的时序信息在鸟声识别中是可行的.受此启发, 张赛花等( An ensemble of convolutional neural networks for audio classification 1 2021 ... 在信息融合研究领域, 数据融合方法大致可分为数据级融合、特征级融合和决策级融合3个阶段(李洋等, 1 2017 ... 鸟声识别问题中存在两个典型任务: 鸟声事件检测与鸟类物种分类(Nugroho et al, Bird species identification via transfer learning from music genres 1 2018 ... 迁移学习策略不仅适用于深度学习模型, 在传统机器学习框架中也得到广泛应用.刘昊天等( Acoustic detection of unknown bird species and individuals 1 2021 ... 上一节阐明了度量学习策略如何处理部分未标注的数据集样本, 然而, 利用数据的内在关系将鸟声样本进行分类的方法(Ntalampiras & Potamitis, Pattern recognition bird sounds based on their type using discreate cosine transform (DCT) and Gaussian methods 1 2019 ... 鸟声识别问题中存在两个典型任务: 鸟声事件检测与鸟类物种分类(Nugroho et al, 基于卷积神经网络的鸟声识别实验设计 1 2022 ... 传统机器学习方法中采用的手工特征由于表征能力受限, 很难高效地应对复杂自然场景下的鸟声识别任务.近年来, 众多学者(Hong & Zabidi, 基于卷积神经网络的鸟声识别实验设计 1 2022 ... 传统机器学习方法中采用的手工特征由于表征能力受限, 很难高效地应对复杂自然场景下的鸟声识别任务.近年来, 众多学者(Hong & Zabidi, All-conv net for bird activity detection:Significance of learned pooling 1 ... 传统机器学习方法中采用的手工特征由于表征能力受限, 很难高效地应对复杂自然场景下的鸟声识别任务.近年来, 众多学者(Hong & Zabidi, Classification of bird sounds as an early warning method of forest fires using convolutional neural network (CNN) algorithm 1 2022 ... 鸟类位于食物链上游, 是监测环境质量和污染状况的良好参考指标.正如人类的声纹具有独特性, 鸣声同样是鸟类的显著生物特征, 可为我们提供发现和识别鸟类的关键信息.鸟声识别是计算机听觉技术的一个重要子领域, 随着人们的生态保护意识不断增强, 鸟声识别的相关研究得到了广泛关注.在生物多样性环境监测、森林火灾预警、涉鸟类案件“打防管控”等领域, 鸟声识别发挥了基础性研究作用(Permana et al, Repertoire-based individual acoustic monitoring of a migratory passerine bird with complex song as an efficient tool for tracking territorial dynamics and annual return rates 1 2016 ... Stowell和Plumbley ( 1 2019 ... 在信息融合研究领域, 数据融合方法大致可分为数据级融合、特征级融合和决策级融合3个阶段(李洋等, 1 2018 ... 在近几年的跨学科研究中, 机器学习技术与鸟声识别的结合引起了广泛的关注.为了深入探究这一主题, 本研究集中分析了自2017年起在多个国际期刊(如Journal of Avian Biology、Ecological Informatics、Applied Acoustics)和国内期刊(如《生物多样性》《声学学报》《应用声学》《机器智能研究(英文版)》等)及顶级学术会议(如International Conference on Acoustics, Speech and Signal Processing、International Speech Communication Association、International Conference on Neural Information Processing)上发表的相关文章, 这些文章涵盖了鸟类学、声学技术和人工智能等领域.通过文献检索, 我们发现深度学习已成为鸟声识别研究的主导方法.然而, 一些传统的机器学习方法仍然适用于某些特定场景的鸟声识别(Mehyadin et al, Automatic recognition of bird individuals on an open set using as-is recordings 1 2016 ... 前述鸟声识别策略均是基于监督学习, 其训练过程依赖具有确切鸟类物种标签的数据样本.然而, 在真实环境中执行鸟声识别可能面临开放性的数据集, 该数据集中可能出现数量和种类均为未知的鸟类声音.深度学习模型的softmax层概率阈值分类是导致无法处理开放数据集的主因(Ptacek et al, 基于机器听觉的鸟声识别的中文研究综述 3 2020 ... 在近几年的跨学科研究中, 机器学习技术与鸟声识别的结合引起了广泛的关注.为了深入探究这一主题, 本研究集中分析了自2017年起在多个国际期刊(如Journal of Avian Biology、Ecological Informatics、Applied Acoustics)和国内期刊(如《生物多样性》《声学学报》《应用声学》《机器智能研究(英文版)》等)及顶级学术会议(如International Conference on Acoustics, Speech and Signal Processing、International Speech Communication Association、International Conference on Neural Information Processing)上发表的相关文章, 这些文章涵盖了鸟类学、声学技术和人工智能等领域.通过文献检索, 我们发现深度学习已成为鸟声识别研究的主导方法.然而, 一些传统的机器学习方法仍然适用于某些特定场景的鸟声识别(Mehyadin et al,
本文的其它图/表
|