Multi_CAST_Source_Sanzhi_Dargwa多语言语音标注文本数据_2311版本

数据集概述

本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Sanzhi Dargwa语言的标注语音文本数据,版本为2311。数据集由班贝格大学发布,是多语言语音语言学研究的结构化资源,仅包含一个压缩文件。

文件详解

  • 文件名称:Multi-CAST/mcsanzhi-v2311.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩文件包含Sanzhi Dargwa语言的标注语音文本数据,具体内容需解压后查看,无公开的README或内容预览。

数据来源

班贝格大学(University of Bamberg)发布的Multi-CAST语料库,引用格式为:Forker, Diana & Schiborr, Nils N. 2023. Multi-CAST Sanzhi Dargwa. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

  • 多语言语音语言学研究: 用于分析Sanzhi Dargwa语言的语音特征、文本结构及标注体系。
  • 语言资源库建设: 作为多语言语料库的组成部分,支持跨语言语音文本的对比研究。
  • 语音技术模型训练: 为Sanzhi Dargwa语言的语音识别、文本标注等技术模型提供训练数据。
  • 语言文献引用: 作为学术研究中Sanzhi Dargwa语言相关分析的标准化语料来源。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 417.02 MiB
最后更新 2026年1月6日
创建于 2026年1月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。