-
Curated_Courier_Based_UNESCO_Courier全刊数字文本语料库_1948_2020
2025年12月27日 30 21 14
数据集概述 本数据集为UNESCO Courier杂志1948-2020年全刊的数字文本语料库,包含文章级和期刊级两种语料。文章级语料提取并重构所有英文文章文本,关联元数据索引;期刊级语料基于UNESCO PDF档案通过OCR生成,平均错误率约0.7%,支持数字文本分析。 文件详解 curated_courier_article_corpus.zip...



