数据集概述
本数据集为CINWA数据库的源数据,核心内容是南美洲本土语言中的栽培植物及其名称记录。包含植物基本信息、本土语言信息、文献来源等结构化数据,支持植物分类学、语言学与文化研究的交叉分析,总计5个文件,覆盖TSV、JSON、BIB三种格式。
文件详解
- 核心数据文件
- 文件名称:main_data.tsv
- 文件格式:TSV
- 字段映射介绍:未提供预览,推测为植物与语言名称的关联数据
- 文件名称:plant_data.tsv
- 文件格式:TSV
- 字段映射介绍:包含plant_id(植物ID)、english_name(英文名称)、local_names(本土名称)、linnean_name(林奈学名)、author_citation(作者引用)、alternative_linnean_name(替代学名)、alternative_author_citation(替代作者引用)、plant_family(植物科属)、plant_region(植物区域)、use(用途)、GBIF(全球生物多样性信息机构标识)等字段
- 文件名称:lang_data.tsv
- 文件格式:TSV
- 字段映射介绍:包含name(语言名称)、family(语言系属)、latitude(纬度)、longitude(经度)、region(区域)、glottocode(语言代码)、iso(ISO代码)、coder(编码者)等字段
- 元数据与来源文件
- 文件名称:cinwa-cldf-metadata.json
- 文件格式:JSON
- 字段映射介绍:包含@context、dc:conformsTo、dc:source、dialect、tables等元数据字段
- 文件名称:sources_data.bib
- 文件格式:BIB
- 字段映射介绍:文献来源引用数据
数据来源
Aguilar Panchi, Evelyn Michelle等编著的CINWA数据库(2022年0.9版本)
适用场景
- 植物分类学研究: 分析南美洲栽培植物的分类体系及本土命名与林奈学名的对应关系
- 语言文化研究: 探索本土语言中植物名称的语义特征及语言系属与植物分布的关联
- 民族植物学分析: 研究南美洲本土社区对栽培植物的传统利用方式与文化意义
- 跨学科数据整合: 支持植物学、语言学、人类学的交叉研究,挖掘生物文化多样性关联
- 文献计量分析: 通过sources_data.bib分析相关研究的文献来源与学术脉络