找到2个数据集

标签: 历史报纸

过滤结果
  • 爱沙尼亚历史报纸众包OCR校正数据集

    2025年12月11日 30 16 1

    数据集概述 该数据集包含爱沙尼亚国家图书馆DIGAR档案中的历史报纸文章及其对应的众包OCR校正内容,涵盖校正数据、统计图表及说明文档,为研究历史报纸文本数字化处理提供支持。 文件详解 文件名称: README.md,文件格式: Markdown,内容说明: 数据集说明文档,包含数据来源、预处理方法(如原始文本逆向工程、过滤规则)等核心信息。...
    packageimg
  • 多语言历史报纸命名实体识别实体链接与立场检测数据集2021

    2025年12月11日 30 151 7

    数据集概述 该数据集为多语言历史报纸资源,包含1850-1950年法语、德语、芬兰语和瑞典语的历史报纸材料,涵盖命名实体识别、实体链接及实体立场检测标注,用于开发和评估历史文档的命名实体处理系统。 文件详解 文件名称: NewsEye-GT-NER_EL_StD-v1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg