数据集

Multi_CAST_Source_Sanzhi_Dargwa多语言语音标注文本数据_2311版本

数据集概述

本数据集为Multi-CAST多语言标注语音文本语料库的一部分，包含Sanzhi Dargwa语言的标注语音文本数据，版本为2311。数据集由班贝格大学发布，是多语言语音语言学研究的结构化资源，仅包含一个压缩文件。

文件详解

文件名称：Multi-CAST/mcsanzhi-v2311.zip
文件格式：ZIP
字段映射介绍：压缩文件包含Sanzhi Dargwa语言的标注语音文本数据，具体内容需解压后查看，无公开的README或内容预览。

数据来源

班贝格大学（University of Bamberg）发布的Multi-CAST语料库，引用格式为：Forker, Diana & Schiborr, Nils N. 2023. Multi-CAST Sanzhi Dargwa. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

多语言语音语言学研究: 用于分析Sanzhi Dargwa语言的语音特征、文本结构及标注体系。
语言资源库建设: 作为多语言语料库的组成部分，支持跨语言语音文本的对比研究。
语音技术模型训练: 为Sanzhi Dargwa语言的语音识别、文本标注等技术模型提供训练数据。
语言文献引用: 作为学术研究中Sanzhi Dargwa语言相关分析的标准化语料来源。

数据与资源

14859961.zipZIP
417.02 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	417.02 MiB
最后更新	2026年1月6日
创建于	2026年1月6日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。