UNIC_Based语料库对齐文件模板数据v1_1

数据集概述

本数据集为UNIC平台的语料库对齐文件模板,包含JSON模板和Excel模板,支持用户按模板结构化语料库对齐文件,可通过转换工具将Excel文件转为JSON压缩包上传至UNIC平台,共包含2个文件。

文件详解

  • UNIC_Alignment template.json
  • 文件格式:JSON
  • 字段映射介绍:JSON结构为对象类型,包含keys字段中的"sentences"键,用于定义语料库对齐文件的JSON模板结构
  • UNIC_Template for an alignment file to be converted.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:语料库对齐文件的电子表格模板,用于结构化对齐数据,可通过转换工具转为JSON压缩包

数据来源

UNIC平台(https://unic.dipintra.it

适用场景

  • 语料库对齐数据结构化:使用模板规范语料库对齐文件的格式,便于上传至UNIC平台
  • 多语言语料库处理:通过模板构建多语言语料库的对齐关系,支持跨语言研究
  • 自然语言处理工具集成:利用模板和转换工具,将结构化对齐数据接入UNIC平台的相关功能
  • 语料库数据标准化:统一语料库对齐文件的格式,提升数据共享和复用效率
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。