-
XML_corpus_Based_文学文本XML语料库数据
2026年1月30日 30 194 182
数据集概述 本数据集为XML格式的文学文本语料库,包含席勒、莱辛、克莱斯特、歌德、蒂克等作家的作品,共56个XML文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理集,所有文件均为XML格式,其中5个含XML元数据。 文件详解 核心文件:...
-
巴西葡萄牙语文学语料库
2025年4月20日 30 71 27
巴西葡萄牙语文学语料库 数据来源:互联网公开数据 标签:文学,葡萄牙语,巴西,文学主题,风格分析,作者识别,历史文本,自然语言处理 数据概述 本数据集收录了1840年至1908年间巴西葡萄牙语文学作品的语料,总字数超过370万字。数据集包含81部独立的文学作品,由多位知名巴西作家创作,包括阿道夫·坎尼亚(Adolfo...



