找到47个数据集

标签: 文本提取

过滤结果
  • TEI_XML_Moravian_See_Voyages_Travel_Diaries_Text_Data

    2025年12月31日 30 189 182

    数据集概述 本数据集包含六份摩拉维亚海航行日记的TEI/XML格式文件,记录了不同年份的航行文本内容,可用于历史航行记录的文本分析与研究,支持自然语言处理相关任务。 文件详解 数据文件 文件名称:1753Text.xml、1742Text.xml、1749Text.xml、1761Text.xml、1746Text.xml、1752Text.xml...
    packageimg
  • MuffinsBonesMore_Based_多格式数据资源分析完整数据

    2025年12月23日 30 23 17

    数据集概述 该数据集包含十六个文件,主要由十五个JPG格式图片文件和一个PDF格式文档文件组成,未提供具体内容描述,文件命名无明显规律,未划分训练测试、数据标签或原始处理数据。 文件详解 图片文件(共十五个):...
    packageimg
  • KORA_SEDANA_TARKIBI_Based_文档分析基础数据

    2025年12月22日 30 175 27

    数据集概述 本数据集包含一份PDF格式的文档,文件名为Muzaffarova Nigora Safarovna.pdf,未提供具体描述信息,文件类型单一,为纯文档类数据。 文件详解 文件名称: Muzaffarova Nigora Safarovna.pdf 文件格式: PDF (.pdf) 内容说明: 未提供该PDF文件的具体字段或内容描述 适用场景...
    packageimg
  • TEMURBEKLАR_TАLIM_TАJRIBАSINI_УАХSHILАSH_Based_教育实践改进文档完整数据

    2025年12月21日 30 89 63

    数据集概述 本数据集为单一PDF文档,围绕“Temurbeklar教育经验改进”主题展开,具体内容需结合文档内容分析,目前可明确其为相关主题的文档类资源。 文件详解 文件名称: Bеkturdiеv Ауbеk Еlmurаtоviсh.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • Tolstoi_Leon_El_cupon_falso_Based_伪造票据主题文学文档完整数据

    2025年12月19日 30 184 68

    数据集概述 本数据集包含一篇PDF格式的文档,文档标题为"El cupon falso",作者为Tolstoi Leon,未提供具体内容描述。 文件详解 文件名称: El_cupon_falso-Tolstoi_Leon.pdf 文件格式: PDF (.pdf) 内容说明: 单篇文档文件,未提供具体内容字段信息。 适用场景 文学研究:...
    packageimg
  • BOBURNOMA_Based_文学环境描述完整PDF数据

    2025年12月19日 30 8 6

    数据集概述 该数据集包含一份PDF文档,主题围绕“BOBURNOMA”相关的文学环境描述,具体内容未提供详细说明,仅包含单一文件。 文件详解 文件名称: Xoliqulova Gulsanam Yorqulovna,.pdf 文件格式: PDF (.pdf) 内容说明: 文档主题为“BOBURNOMA”相关的文学环境描述,具体字段及内容未提供进一步信息...
    packageimg
  • Mahler_Ramsey_Collatz_Based_数学理论相关数据可视化完整数据集

    2025年12月19日 30 158 135

    数据集概述 本数据集包含与Mahler-Ramsey-Collatz主题相关的3个文件,主要为SVG格式图像文件和PDF格式文档文件,未提供具体内容描述,文件命名无明显规律。 文件详解 文件名称:385 PM62TM345.svg,文件格式:SVG,未提供字段或内容描述 文件名称:1110 LoH5.svg,文件格式:SVG,未提供字段或内容描述...
    packageimg
  • Vert_7_of_Muffin_s_Bones_Based_骨骼第七部分多模态数据完整数据集

    2025年12月18日 30 9 2

    数据集概述 该数据集包含八个文件,涉及Muffin骨骼第七部分(Vert 7)的相关内容,文件类型涵盖图像、三维模型、文档等,未提供详细描述信息。 文件详解 该数据集包含八个独立文件,具体说明如下: - 图像文件 (.jpg): - v7172_vert7reRedone.jpg: JPG格式图像文件 - v7172-7a.JPG: JPG格式图像文件...
    packageimg
  • 数据1942_1943年总督辖区奥尔雷乡预算数据集

    2025年12月16日 30 203 32

    数据集概述 本数据集包含1942-1943年总督辖区奥尔雷乡(Gmina Orły)的预算文件,数据来源于普热梅希尔国家档案馆的奥尔热霍夫采乡档案,是“总督辖区农村地区地方行政文件(1939-1945)——原始资料整理”项目的研究成果,为研究二战期间波兰农村地区财政状况提供历史档案支持。 文件详解 图片文件:...
    packageimg
  • 希腊教父文献集OCR标注数据集2021_2022

    2025年12月14日 30 97 26

    数据集概述 该数据集是希腊教父文献集(Patrologia Graeca)的OCR标注基准数据,包含2021-2022年期间人工标注的100张文献图像及对应PageXML文件,覆盖文本区域检测(希腊文、拉丁文列、脚注、标题)和古多调希腊文识别(行级标注)两类任务,用于OCR模型训练与验证。 文件详解 核心文件:...
    packageimg
  • 问卷数据计费系统数据集

    2025年12月13日 30 139 102

    数据集概述 该数据集包含一个PDF格式的问卷数据计费系统相关文档,未提供具体内容描述,主要用于呈现与问卷数据计费系统相关的信息。 文件详解 文件名称: Questionnaire Data Set SAP Billing.pdf 文件格式: PDF (.pdf) 内容说明: 文档类型文件,具体内容未提供详细描述,推测与问卷数据计费系统相关 适用场景...
    packageimg
  • bjkbnnm_Assignments_Fall_2020_Based_教育作业PDF文档完整数据

    2025年12月10日 30 48 35

    数据集概述 该数据集包含一个PDF格式的文件,文件名称为Assignments-Fall-2020_5.pdf,无子目录结构,未涉及训练/测试、数据/标签、原始/处理数据等常见数据划分类型。 文件详解 文件名称: Assignments-Fall-2020_5.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • Tamara_Texts_Based_智能手机电子设备主题文档完整数据

    2025年12月9日 30 140 100

    数据集概述 本数据集包含1个PDF格式文档,标题为“SMARTFONLARMI, GADJETLARMI YOKI…???”,未提供具体内容描述,推测与智能手机、电子设备相关主题相关。 文件详解 文件名称: Ortiqboyeva Tamara Musurmonqulovna .pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • INNOVATSION_FAOLIYAT_VA_INNOVATSION_SALOHIYAT_Based_创新实践与需求主题文档完整数据

    2025年12月8日 30 36 32

    数据集概述 本数据集包含一个PDF格式的文档,核心内容围绕“Innovatsion Faoliyat va Innovatsion Salohiyat”主题展开,具体内容需通过文档原文获取。 文件详解 文件名称: Xamrayeva Nazira Ravshaovna.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • Meyliyeva_Muqaddas_Muzaffar_kizi_Based_THE_BOOK_IS_THE_KEY_TO_PERFECTION文本内容完整数据

    2025年12月7日 30 105 61

    数据集概述 本数据集包含一份标题为“THE BOOK IS THE KEY TO PERFECTION”的PDF文档,未提供具体描述内容,文件由Meyliyeva Muqaddas Muzaffar kizi相关信息命名。 文件详解 文件名称: Meyliyeva Muqaddas Muzaffar kizi.pdf 文件格式: PDF (.pdf)...
    packageimg
  • АБДУЛЛА_ОРИПОВ_ТЕРАН文档内容分析完整数据

    2025年12月5日 30 143 115

    数据集概述 该数据集包含一份PDF文档,核心内容围绕АБДУЛЛА ОРИПОВ在ШЕЪРИЯТИДАГИ ТЕРАН ҲИКМАТЛАРНИНГ ЖОЗИБАСИ主题展开,具体内容需通过文档内容分析获取。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Хамдамов Акрам Насриддинович.pdf -...
    packageimg
  • 变革推动者沟通策略第五区2025

    2025年11月27日 30 118 16

    数据集概述 本数据集包含2025年针对第五区Pertamina EP办公室员工与现场员工的访谈记录,围绕变革推动者沟通策略主题展开,为分析企业内部沟通机制与变革推进情况提供质性数据支持。 文件详解 该数据集包含一个目录及单个文档文件,具体说明如下: - 目录: COMMUNICATION STRATEGY AGENT OF CHANGE ZONE 5...
    packageimg
  • 医疗健康住院患者临床数据分析数据集

    2025年11月25日 30 5 3

    医疗健康住院患者临床数据分析数据集_Clinical_Data_Analysis_Dataset_for_Hospitalized_Patients 数据来源:互联网公开数据 标签:医疗健康,临床数据,患者住院,文本分析,时间序列分析,疾病诊断,自然语言处理,医学研究 数据概述:...
    packageimg
  • Kaggle论坛文本提取数据集-简版

    2025年5月31日 30 201 78

    Kaggle论坛文本提取数据集-简版 数据来源:互联网公开数据 标签:Kaggle,论坛,文本提取,数据集,简版,机器学习,数据科学,社区讨论 数据概述: 本数据集是从Kaggle论坛中提取的文本和提示信息的简版数据集。它旨在提供Kaggle社区讨论和交流的内容,包含了大量的文本数据,适用于分析论坛内容、社区互动模式以及机器学习相关话题的讨论。...
    packageimg
  • 土耳其新闻摘要句子数据集-serdarcaglar

    2025年5月31日 30 29 8

    土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:...
    packageimg