Modified_Based_Uropygi分类模拟数据集

数据集概述

本数据集基于Museu Paraense Emilio Goeldi的Uropygi Collection数据集(2023版)修改而来,通过转换为Excel格式并引入三类故意错误(属名、目名、界名拼写错误),用于测试pytaxon工具的分类学错误检测与纠正能力,仅包含一个文件。

文件详解

  • 文件名称:Uropygi Collection.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含原始Uropygi Collection数据集的分类学信息,其中故意引入的错误字段已标黄:属名"Thelyphonelus"被改为"Thelyphoneluss"、目名"Uropygi"被改为"Urophygi"、界名"Animalia"被改为"Aanimalia"。

数据来源

Bonaldo A (2023). Museu Paraense Emilio Goeldi - Uropygi Collection. Version 4.2. Museu Paraense Emílio Goeldi. Occurrence dataset. Available at: https://doi.org/10.15468/xt4kfa

适用场景

  • 分类学工具测试:用于评估pytaxon等工具对常见分类数据录入错误的检测与纠正性能。
  • 生物分类数据质量控制研究:分析分类学数据中拼写错误的类型及对数据准确性的影响。
  • 数据处理算法验证:验证分类学数据错误处理算法在实际数据集上的有效性。
  • 生物信息学教学:作为教学案例,演示分类学数据错误检测与纠正的方法和流程。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.02 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。