HAO_BHL_Based_膜翅目解剖学本体扩展工具与文献数据

数据集概述

本数据集围绕膜翅目(含叶蜂、蜜蜂、黄蜂、蚂蚁等)解剖学本体(HAO)扩展工作展开,包含用于从生物多样性遗产图书馆(BHL)文献中发现解剖学术语的工具及相关数据,涉及术语识别、分类群分组、文献文本等内容,共7个文件,支持本体迭代构建研究。

文件详解

  • 文本文件(.txt)
  • 文件名称:g2.txt、terms.txt、JHR_articles.txt
  • 内容说明:g2.txt含分类群与二进制编码数据;terms.txt为解剖学术语列表;JHR_articles.txt为相关文献文本
  • 表格文件(.csv)
  • 文件名称:groups.csv
  • 字段映射:包含family(科)、superfamily(总科)、suborder(亚目)三个分类层级字段
  • 压缩文件(.zip)
  • 文件名称:result_trees.zip、script_modifications_for_mx.zip
  • 内容说明:存储结果树数据及脚本修改文件
  • 代码文件(.r)
  • 文件名称:doclust.R
  • 内容说明:用于聚类分析的R语言脚本

数据来源

论文“Utilizing descriptive statements from the Biodiversity Heritage Library to expand the Hymenoptera Anatomy Ontology”

适用场景

  • 生物本体构建:支持膜翅目解剖学本体(HAO)的迭代扩展与术语标准化
  • 分类学文本挖掘:分析分类学家使用的领域术语及其分类群特异性规律
  • 生物多样性文献利用:挖掘BHL文献中的解剖学描述信息,辅助物种表型研究
  • 本体工具评估:验证Proofer工具在术语发现与本体构建中的有效性
  • 分类系统分析:基于groups.csv的分类群层级数据开展膜翅目分类研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 50.67 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。