-
UNIC_Templates_Based语料库元数据上传标准化模板v1_11
2026年1月20日 30 172 53
数据集概述 本数据集包含UNIC平台(https://unic.dipintra.it)用于上传语料库元数据的两种模板文件,版本为v1.11。支持通过JSON文件直接上传,或使用Excel模板输入后转换为JSON。Excel模板含宏验证功能,用户需保持列顺序,新增内容可在现有列后添加新列。 文件详解 UNIC_Metadata upload...
-
OpenITI_Self_reuse_Based_2023_1_8_文本复用研究完整数据集
2025年12月23日 30 115 65
数据集概述 该数据集包含OpenITI 2023.1.8版本语料库及其对应passim运行的自复用数据,由Sarah Bowen Savant用于撰写专著。数据以CSV格式为主,辅以PDF说明文档,记录文本复用统计与语料库元数据,为自然语言处理(NLP)领域的文本复用研究提供支持。 文件详解 数据文件(CSV格式): KITAB-TextReuse-...



