数据集概述
本数据集为LADDER语料库,包含意大利语母语者及德语背景学习者的数字交流文本,涵盖邮件、WhatsApp即时消息两种媒介,涉及请求、拒绝等言语行为及不同社交距离场景。数据含文本内容及元数据,支持意大利语L2语用能力习得研究,总规模约5.29万词,含多格式文件。
文件详解
- CSV格式文件(2个)
- 文件名称:Mail Corpus.csv、Instant Messaging Corpus.csv
- 字段映射:含时间、文本内容(邮件/消息)、意大利语水平、年龄、母语、教育背景、外语知识等元数据字段
- XML格式文件(2个)
- 文件名称:Corpus_Ladder_31052021.xml、Corpus_Ladder_31052021_useLb.xml
- 内容说明:语料库结构化存储文件,保留表情符号及特殊字符,支持长期归档与数据交换
- XLSX格式文件(1个)
- 文件名称:Mail Corpus 28032022.xlsx
- 内容说明:邮件语料及元数据的Excel表格,含学习者与母语者的邮件文本及相关信息
数据来源
因斯布鲁克大学教育研究所、罗马第三大学合作项目
适用场景
- 意大利语二语语用能力研究: 分析不同水平学习者在请求、拒绝等言语行为中的语用表现差异
- 数字媒介语用对比分析: 比较邮件与即时消息在语用策略、形式选择上的差异
- 社交距离与语用策略关联研究: 探索不同社交距离场景下的语言使用规律
- 二语习得教学资源开发: 为意大利语L2教学提供真实语用案例参考
- 跨文化语用对比: 对比母语者与学习者在数字交流中的语用选择差异