找到11个数据集

标签: 文档数字化

过滤结果
  • READ_ABP_Table_Based_历史登记册表格识别实验完整数据

    2025年12月16日 30 91 68

    数据集概述 该数据集为历史登记册表格识别研究相关数据,包含用于对比机器学习方法的实验数据,涉及不同版本的图像及标注文件,支持表格文本行、单元格等元素的识别分析。 文件详解 该数据集包含一个ZIP格式压缩文件,具体说明如下: - 文件名称: READ_ABP_TABLE.zip - 文件格式: ZIP (.zip) - 内部目录及内容: -...
    packageimg
  • 单作者手写删除线数据集

    2025年12月15日 30 77 1

    数据集概述 该数据集包含单作者手写文字的清洁版与删除线版配对图像,文字内容取自《德古拉》片段,删除线类型涵盖横线、对角线等七种。数据按删除线类型均衡分为训练、验证、测试子集,支持手写删除线去除任务研究。 文件详解 压缩文件: train.zip:训练集压缩文件,包含训练用的手写文字图像对及对应CSV文件...
    packageimg
  • 德国巴登_巴登弗里德里希药房历史文献集

    2025年12月15日 30 127 15

    数据集概述 该数据集包含德国巴登-巴登弗里德里希药房的历史文献,主要为1924年和1948年的历史问卷、索引卡片及部分附件,通过Kalliope门户编目,记录药房历史相关信息。 文件详解 文件名称:08170.pdf,文件格式:PDF,内容为药房历史相关的文档类资料 文件名称:08170.tiff,文件格式:TIFF,内容为药房历史相关的光栅图像类资料...
    packageimg
  • YUNUS_RAJABIY_MUSUQIY_MAKTABI_Based_音乐学校教育资料完整PDF数据

    2025年12月12日 30 73 28

    数据集概述 该数据集包含一个与YUNUS RAJABIY MUSUQIY MAKTABI相关的PDF文档,具体内容未提供详细描述,仅包含单个PDF文件。 文件详解 文件名称: Abdullayeva Aziza.pdf 文件格式: PDF (.pdf) 文件内容: 未提供具体内容描述,为单个PDF文档文件 适用场景 教育机构资料整理: 可用于YUNUS...
    packageimg
  • Objaverse_BZH16a_VCA_Based_20160615安全指导完整数据_注_根据数据来源中的_贝泽尔_英文谐音推测_原数据中的_贝特勒姆_...

    2025年12月9日 30 93 35

    数据集概述 本数据集包含2016年6月15日的VCA安全指导说明相关文件,主要为图片和三维模型文件,用于展示安全指导的重点内容。 文件详解...
    packageimg
  • 自然场景下手写文档布局分析基准数据集

    2025年12月8日 30 167 43

    数据集概述 该数据集为自然场景下的手写文档布局分析提供基准数据,涵盖不同布局、语言和书写条件的历史与现代手写文档,包含页面分段及对应标签标注,用于评估布局分析方法的泛化能力。 文件详解 文件名称: HDLA-in-the-wild.zip 文件格式: ZIP压缩包 内容说明: 包含自然场景下手写文档布局分析的基准数据,具体文件结构需解压后查看 数据来源...
    packageimg
  • 艾托夫药房历史文献数据集1924_1947

    2025年12月7日 30 4 2

    数据集概述 该数据集包含德国艾托夫药房的历史文献,主要为1924至1948年间的调查问卷、索引卡及部分精选附件,通过Kalliope门户编目,记录药房历史相关信息,包含PDF与TIFF格式文件。 文件详解 文件名称:18160.pdf,文件格式:PDF,占比百分之五十,为文档类文件,内容涉及药房历史相关的调查问卷或索引卡文本记录...
    packageimg
  • 德国Hecklingen地区Schwan药房历史文献集1924_1948

    2025年12月6日 30 203 188

    数据集概述 本数据集包含德国Hecklingen地区Schwan药房的历史文献,主要为1924至1948年间的历史问卷、索引卡片及部分附录材料,通过Kalliope门户网站编目,记录该药房的发展历史,包含PDF和TIFF两种格式的文件。 文件详解 文件名称: 18919.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 德国柯尼斯堡凯撒药房历史文献数据集1924_1948

    2025年12月6日 30 95 8

    数据集概述 本数据集包含德国柯尼斯堡凯撒药房的历史文献,主要为1924-1948年间的调查问卷、索引卡片及部分附件,记录该药房历史,通过Kalliope门户编目。 文件详解 文件名称:19390.pdf 文件格式:PDF 内容说明:可能为药房历史相关的文档类文件 文件名称:19390.tiff 文件格式:TIFF...
    packageimg
  • 希腊议会二战后会议记录分析与识别数据集1946_1947

    2025年12月5日 30 137 134

    数据集概述 该数据集通过文本识别与自然语言处理技术,解锁1946-1947年希腊议会会议记录的历史语料。包含经Transkribus训练的文本识别模型处理的3156张扫描图像,以及通过语言模型优化、信息提取技术分析的演讲数据,首次量化了获得掌声的议题。 文件详解 文件名称: README.md,文件格式: Markdown,内容:...
    packageimg
  • 数据80行手写乌尔都语OCR数据集

    2025年4月14日 30 203 8

    数据80行手写乌尔都语OCR数据集 数据来源:互联网公开数据 标签:手写识别,乌尔都语,OCR,光学字符识别,自然语言处理,文档数字化,历史文献 数据概述:...
    packageimg