杜洪比程序性文本转录解析与翻译数据集

数据集概述

本数据集包含杜洪比语程序性文本的多格式文件,涉及狩猎豪猪、制作发酵大豆等七种活动的录音及对应转录、解析、注释与翻译内容,配套语法说明及工具配置文件,为语言研究提供支撑。

文件详解

  • 核心数据文件:
  • 音频文件(.wav):7个,对应七种活动的原始录音,如CHUK220413A1.wav(捕蛙)
  • 转录文件(.trs):7个,Transcriber格式,记录音频转录内容,如CHUK230512A1A.trs(制作发酵大豆)
  • 注释文件(.txt):7个,Toolbox兼容格式,含转录、注释及翻译,字段含ELAN时间戳、参与者、声音文件关联等
  • 文档文件(.pdf):7个,对应文本的完整转录、注释与翻译内容,如CHUK220413B1.pdf(收集蜂蜡)
  • 工具配置文件:
  • Settings.zip:压缩包,含杜洪比语IPA键、Toolbox数据库设置、杜洪比语词典及解析词典

数据来源

Timotheus Adrianus Bodt《Grammar of Duhumbi》(2020)配套数据

适用场景

  • 语言学研究:用于杜洪比语语法分析、语音特征研究及程序性文本语言结构探究
  • 民族志研究:分析杜洪比社群传统生产生活活动的语言表述与文化内涵
  • 语言资源建设:支撑杜洪比语词典、语料库等语言资源的开发与完善
  • 教育教学:作为濒危语言教学或语言田野调查方法的实践案例素材
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 153.77 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。