-
linhd_postdata_Based_Poesi_as诗歌语料库_公开数据集
2026年1月19日 30 12 1
数据集概述 本数据集为Poesi.as网站的诗歌语料库,包含以西班牙语为主的诗歌作品,覆盖21世纪及以前的创作,总计25,187首诗歌、7,918,679个词汇。提供诗歌文本JSON文件、作者信息CSV文件及公共领域诗歌提取脚本,支持西班牙语文学相关研究与分析。 文件详解 主数据集压缩包 文件名称:linhd-...
-
TRIDIS_Based_中世纪与近代早期多语言手稿手写文本识别模型数据11th_16th
2026年1月17日 30 174 97
数据集概述 本数据集包含TRIDIS手写文本识别(HTR)模型相关文件,该模型针对11-16世纪中世纪与近代早期多语言(拉丁语、古法语、古西班牙语)手稿设计,适用于法律、行政等纪实类手稿及文学、学术文献。数据集含模型文件与元数据,支持历史文本数字化与分析。 文件详解 文件名称:metadata.json 文件格式:JSON...



