生物多样性 ›› 2026, Vol. 34 ›› Issue (2): 25256. DOI: 10.17520/biods.2025256
• • 下一篇
纪林1,2,3, 邓宸迅1,2,3, 王丽凤1,2,3, 王德港1,2,3, 王建涛4, 于永永4, 张军国1,2,3*
Lin Ji1,2,3, Chenxun Deng1,2,3, Lifeng Wang1,2,3, Degang Wang1,2,3, Jiantao Wang4, Yongyong Yu4, Junguo Zhang1,2,3*
1 School of Technology, Beijing Forestry University, Beijing 100083, China
2 State Key Laboratory of Efficient Production of Forest Resources, Beijing 100083, China
3 Research Center for Biodiversity Intelligent Monitoring, Beijing Forestry University, Beijing 100083, China
4 Administration of Ulanba National Nature Reserve, Chifeng, Inner Mongolia 025450, China
摘要: 内蒙古乌兰坝国家级自然保护区野生动物的保护对维护当地生物多样性具有重要意义。随着人工智能技术的快速发展, 利用深度学习方法对野生动物图像进行自动识别, 已成为野生动物调查保护的关键手段。实际采集的野生动物图像数据通常呈现一种偏态分布特征, 即少数高频类别物种样本充足, 而大多数低频类别物种样本稀缺, 影响模型的整体识别性能。针对这一问题, 本文提出一种面向偏态分布的野生动物识别方法Diff-SCC。首先, 该方法利用大语言模型生成类别的丰富语义描述, 引导扩散模型生成额外样本, 同时引入多尺度负样本筛选策略, 从像素空间、特征空间及语义空间3个维度进行图像质量评估和筛选, 提升低频类别的特征多样性并平衡数据分布。其次, 本文在主干网络ResNet50中引入SCConv模块以减少空间与通道建模过程中的冗余特征, 并增强模型对前景区域的感知能力, 从而提高模型对低频类别的识别性能。最后, 本文在自建数据集ULB-12和野生动物公开数据集NACTI上开展对比实验以验证模型的性能。实验结果显示, Diff-SCC模型在上述两个数据集上的整体识别准确率分别达到78.71%和80.84%, 低频类别的识别准确率相较基线模型分别提升9.96%和9.99%。上述结果验证了Diff-SCC在处理偏态分布数据集的有效性, 能够为野生动物智能监测与保护提供可靠的技术支撑。