科隆基茨德语语料库2023

数据集概述

本数据集是记录科隆地区城市青年语言变体“基茨德语”的语料库,包含约三小时非正式对话的音频文件及转录文本。数据采集自科隆某技术与媒体类职业学院的十七至二十岁男性学生,分为单语者、多语者及混合三组,覆盖学校、饮食、宗教等日常话题,为研究城市青年语言使用提供实证基础。

文件详解

  • 转录文件(PDF格式):
  • 02_G1 - Multilingual speakers (transcription).pdf:多语者组对话转录文本
  • 04_G2 - Monolingual speakers (transcription).pdf:单语者组对话转录文本
  • 06_G3 - Multilingual & monolingual speakers (transcription).pdf:混合组对话转录文本
  • 转录文本为德语,副语言特征(如停顿、笑声)采用GAT 2英文符号标注
  • 音频文件(MP3格式):
  • 01_G1 - Multilingual speakers (audio).mp3:多语者组对话音频
  • 03_G2 - Monolingual speakers (audio).mp3:单语者组对话音频
  • 05_G3 - Multilingual & monolingual speakers (audio).mp3:混合组对话音频

数据来源

Zenodo

适用场景

  • 社会语言学研究:分析科隆地区基茨德语的语言特征与区域变体
  • 青年语言研究:探究城市青年日常对话中的语言使用模式
  • 多语现象研究:对比单语与多语背景青年的口语表达差异
  • 语料库语言学分析:基于转录文本开展词汇、句法及语用特征研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 151.44 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。