昆虫自动声学识别数据集_InsectSet32

数据集概述

本数据集包含32种发声昆虫的录音,共335个文件,总时长57分钟。数据分为直翅目(9种,147个文件)和蝉科(23种,188个文件)两部分,用于训练神经网络自动识别昆虫物种,并比较不同音频特征提取方法的效果。

文件详解

该数据集由多个文件组成,具体说明如下: - 文档文件: - README.txt: 文本格式,提供数据集的整体描述、构建目的及使用说明。 - 标注文件: - Cicadidae.csv: CSV格式,包含蝉科录音的标注信息,字段包括file_name(文件名)、species(物种名)、class_ID(类别ID)、data_set(数据集划分)、original_file_name(原始文件名)。 - Orthoptera.csv: CSV格式,包含直翅目录音的标注信息,字段与Cicadidae.csv一致。 - 音频压缩包: - Cicadidae.zip: ZIP格式压缩包,包含蝉科昆虫的音频文件。 - Orthoptera.zip: ZIP格式压缩包,包含直翅目昆虫的音频文件。

数据来源

  • 直翅目数据来源:Baudewijn Odé(未发表)
  • 蝉科数据来源:Global Cicada Sound Collection(Bioacoustica平台)

适用场景

  • 昆虫声学分类研究: 用于训练和测试基于音频的昆虫物种自动识别模型。
  • 音频特征提取方法比较: 对比自适应波形前端与传统梅尔频谱前端在昆虫声学识别中的效果。
  • 生物声学应用开发: 为农业害虫监测、生物多样性调查等场景提供数据支持。
  • 机器学习模型复现: 可用于复现PLOS Computational Biology发表研究的实验结果。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 255.99 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。