数据集概述
本数据集包含UNIC平台(https://unic.dipintra.it)用于上传语料库元数据的两种模板文件,版本为v1.11。支持通过JSON文件直接上传,或使用Excel模板输入后转换为JSON。Excel模板含宏验证功能,用户需保持列顺序,新增内容可在现有列后添加新列。
文件详解
- UNIC_Metadata upload template v1.1.xlsm
- 文件格式:XLSM
- 字段映射介绍:含宏的Excel模板,用于输入语料库元数据,宏可自动验证列输入内容,需保持原有列顺序,新增元素可在现有列后添加新列
- UNIC_Metadata template.json
- 文件格式:JSON
- 字段映射介绍:JSON模板文件,结构为对象类型,包含event、sourceText、targetText、transcriber、annotator、annotation、alignment、actor、interpreter等核心字段
数据来源
UNIC平台(https://unic.dipintra.it)
适用场景
- 语料库元数据标准化上传:为UNIC平台用户提供规范的元数据输入模板,确保数据格式符合平台要求
- 多格式元数据转换:支持Excel模板输入与JSON格式输出的转换,适配不同用户的操作习惯
- 元数据输入验证:通过Excel宏自动校验输入内容,提升元数据质量
- 语料库管理工具开发:为语料库管理系统提供标准化元数据模板参考,支持定制化扩展需求