现代标准斯拉夫语支平行文本数据集

数据集概述

本数据集包含克罗地亚语、斯洛伐克语、斯洛文尼亚语三种现代标准斯拉夫语支的平行文本,以《约翰福音》为内容,通过平行文本设计抵消体裁影响,为语言比较研究提供基础数据。

文件详解

  • 文件名称:Gospel.Croatian.txt;格式:TXT;内容:克罗地亚语版《约翰福音》文本,基于伊万·沙里奇的新约译本
  • 文件名称:Gospel.Slovak.txt;格式:TXT;内容:斯洛伐克语版《约翰福音》文本,基于现代天主教新约译本
  • 文件名称:Gospel.Slovenian.txt;格式:TXT;内容:斯洛文尼亚语版《约翰福音》文本,基于标准斯洛文尼亚语新约译本
  • 文件名称:DATA_STATEMENT.pdf;格式:PDF;内容:数据集相关的数据声明文档

数据来源

  • 克罗地亚语:伊万·沙里奇的新约译本
  • 斯洛伐克语:现代天主教新约译本
  • 斯洛文尼亚语:标准斯洛文尼亚语新约译本

适用场景

  • 斯拉夫语支语言距离测量与聚类分析
  • 现代斯拉夫语言比较语言学研究
  • 平行语料库构建与语言特征对比分析
  • 基于小样本无标注语料的语言研究方法验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.43 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。