ELTeC_ukr_Based_乌克兰小说语料库2021年4月发布数据

数据集概述

本数据集为ELTeC-ukr乌克兰小说语料库2021年4月发布版本,包含50部编码为1级的乌克兰小说。数据集共2个文件,无目录结构,主要文件类型为压缩包和说明文档,用于支持欧洲文学远程阅读研究。

文件详解

  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:包含语料库基本信息、贡献者列表、项目背景(COST Action CA16204相关信息)及DOI引用标识等内容。
  • 文件名称:ELTeC-ukr-0.5.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含50部编码为1级的乌克兰小说文本数据,具体内容需解压后查看。

数据来源

COST Action Distant Reading for European Literary History(CA16204)

适用场景

  • 欧洲文学远程阅读研究: 用于分析乌克兰小说的文学特征、主题趋势及语言风格。
  • 文学语料库构建参考: 为多语言文学语料库的编码标准和结构设计提供实例。
  • 乌克兰文学数字化保存: 作为标准化编码的文学文本资源,支持乌克兰文学作品的数字化存档与传播。
  • 计算语言学研究: 用于乌克兰语词汇、句法等语言特征的统计分析和模型训练。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.76 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。