ELTeC_pol_Based_波兰小说语料库_2021年4月发布版

数据集概述

本数据集是ELTeC(欧洲文学文本集合)的波兰语小说语料库2021年4月发布版,包含100部波兰语小说。数据集支持欧洲文学远程阅读研究,由COST Action CA16204项目产出,所有文本均属于公有领域,可用于文学文本分析、语言研究等场景。

文件详解

  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集基本信息,如项目背景、贡献者(Joanna Byszuk、Jan Rybicki)、许可协议(公有领域)、引用建议及DOI链接(10.5281/zenodo.4662596)
  • 文件名称:ELTeC-pol-1.0.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包文件,包含100部波兰语小说的文本内容,具体内部文件结构未明确说明

数据来源

COST Action Distant Reading for European Literary History (CA16204)

适用场景

  • 欧洲文学比较研究:用于分析波兰语小说与其他欧洲语言文学作品的风格、主题差异
  • 波兰文学文本分析:研究波兰语小说的语言特征、叙事结构及文学流派演变
  • 数字人文研究:支持基于大规模语料的远程阅读、文本挖掘等数字人文方法应用
  • 语言学研究:分析波兰语在文学文本中的语法、词汇使用规律
  • 教学资源开发:作为波兰语学习或文学教学的语料素材
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 22.9 MiB
最后更新 2026年1月26日
创建于 2026年1月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。