找到32个数据集

标签: 历史文本

过滤结果
  • forTEXT_Based_叙事学历史文本标注集_可供下载

    2026年1月30日 30 28 24

    数据集概述 本数据集为叙事学(历史文本方向)标注集,适用于标注文本中的叙事元素,包含历史文本内容分析的基础分类,具体用于人物与情节分析。数据集提供XML格式的标注集文件,可支持叙事文本的结构化标注工作。 文件详解 文件名称:forTEXT_Tagset_Narratologie_histoire.xml 文件格式:XML...
    packageimg
  • CEEC_Based_历史英语拼写规范化人工标注测试集数据

    2026年1月30日 30 172 128

    数据集概述 本数据集为CEEC语料库历史英语规范化测试集,包含人工生成的三组历史-现代拼写对列表:混合世纪列表、15世纪列表和18世纪列表,每组各100对。历史形式均源自CEEC语料库,总计包含一个文件。 文件详解 文件名称:test_set_of_normalizations.xlsx 文件格式:XLSX...
    packageimg
  • NARRATIVAS_DE_ENTERRO_墓葬叙事转录文档数据

    2026年1月28日 30 2 1

    数据集概述 本数据集包含一份转录的墓葬叙事文档,聚焦于墓葬相关的叙事内容转录,为文化研究领域提供结构化的文本资料,可用于分析墓葬叙事的文化内涵与表达形式。 文件详解 文件名称:NARRATIVAS DE ENTERRO (1) (1).docx 文件格式:DOCX...
    packageimg
  • Mapping_plague_Based_自然语言处理鼠疫地理映射数据集

    2026年1月21日 30 128 117

    数据集概述 本数据集为“通过自然语言处理映射鼠疫”项目的配套数据与代码,包含基于Sticker(1908)和Biraben(1975)两部鼠疫论著生成的原始文件、中间数据产品及最终地理编码鼠疫数据集,用于研究NLP库与地理编码服务从叙事文本生成量化数据集的性能。 文件详解 核心数据文件...
    packageimg
  • KBNL03000040140_Entangled_Histories_乌得勒支地区公告集转录数据1856

    2025年12月31日 30 196 126

    数据集概述 本数据集为《Mr. Johan van de Water's Groot plakkaatboek 'slands van...
    packageimg
  • 巴斯克历史文本语料库

    2025年12月21日 30 164 116

    数据集概述 该数据集是一个巴斯克历史文本语料库,包含为某项研究分析的历史文本,按文本体裁和方言分类,并附来源参考信息,为研究巴斯克语言历史与文化提供数据支持。 文件详解 文件名称: Corpus_of_historic_Basque_texts.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 法国大革命议会档案中上帝提及与名称数据集

    2025年12月21日 30 27 18

    数据集概述 该数据集通过对法国大革命时期议会档案(Archives Parlementaires)的远距离阅读,统计了档案中上帝相关名称的提及情况,并按时间分类。数据反映了上帝提及频率及名称使用的变化趋势,说明上帝提及在大革命政治文化中的重要性,因隐性表达和OCR误差,实际数据可能更高。 文件详解 Excel数据文件(共8个):...
    packageimg
  • 数据1502与2019年语言学分析_俄罗斯早期外交文书集

    2025年12月20日 30 112 20

    数据集概述 本数据集基于国际语言学研讨会报告扩展,以语言学专家领域方法分析1502年与1505年俄罗斯早期外交文书集,探讨古乌克兰方言文本真实性、诺夫哥罗德译员身份等历史语言现象,涉及克里米亚、马克西米利安一世信使等案例。 文件详解 文件名称: 1502__2019 (2).pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 科学演化剖析数据集

    2025年12月20日 30 185 31

    数据集概述 该数据集围绕科学演化展开研究,通过分析1800至2008年间大规模数字化英文文本语料,揭示科学概念的早期使用水平与长期影响力的关联性,包含相关分析结果与模型预测数据。 文件详解 Metadata.html:HTML格式文件,可能包含数据集的元数据信息...
    packageimg
  • 开姆尼茨夏洛特药房历史档案数据集1924_1948

    2025年12月18日 30 47 25

    数据集概述 该数据集包含德国开姆尼茨夏洛特药房的历史档案,核心内容为1924年与1948年的历史问卷、索引卡片及部分相关附件,通过Kalliope门户编目,记录药房历史相关信息。 文件详解 文件名称: 08722.pdf,文件格式: PDF,为文档类文件,可能包含药房历史问卷或档案文本内容 文件名称: 08722.tiff,文件格式:...
    packageimg
  • 古希腊语与葡萄牙语翻译对齐标准与黄金标准数据集

    2025年12月18日 30 1 0

    数据集概述 本数据集包含古希腊语文本与葡萄牙语翻译对齐的指导标准及黄金标准数据,基于古希腊语-英语对齐指南改编,由领域专家使用Ugarit工具完成对齐,可支持相关文本对齐任务、数据集构建或自动化模型训练。 文件详解 文件名称:grc.txt 文件格式:.txt 内容说明:原始古希腊语文本文件 文件名称:por.txt 文件格式:.txt...
    packageimg
  • 古希腊语到英语翻译对齐标注指南与黄金标准数据集

    2025年12月15日 30 167 83

    数据集概述 该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。 文件详解 文件名称: eng.txt 文件格式: TXT (.txt) 内容说明:...
    packageimg
  • 古希腊与拉丁语翻译对齐标注指南及黄金标准数据集

    2025年12月14日 30 87 56

    数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...
    packageimg
  • 历史PCM文本语料库附录_18_21世纪

    2025年12月14日 30 58 20

    数据集概述 本数据集为研究用18至21世纪历史PCM文本语料库的附录文件,包含相关文本内容,以单一PDF格式存储,未划分训练测试或数据标签集。 文件详解 文件名称: Appendix_corpus_of_historic_(18th-21st_century)_PCM_texts.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • Objaverse_Castello_Rosso_Based_中世纪城堡历史数字化完整数据

    2025年12月14日 30 147 74

    数据集概述 本数据集包含关于Castello Rosso城堡的历史文本描述及相关文件,记录了该城堡从1030年拜占庭时期始建,到1359年被威尼斯收购等关键历史阶段的变迁,为研究城堡历史沿革提供资料。 文件详解 历史文本文件(标题:Dc19f7471c234ee1ae276ac1438e7789):包含Castello...
    packageimg
  • 哈雷弗里德里希广场药房历史档案数据集1924_1948

    2025年12月13日 30 168 51

    数据集概述 本数据集包含德国哈雷弗里德里希广场药房的历史档案,主要为1924至1948年的历史问卷、索引卡片及部分相关附件,记录该药房的历史发展,通过Kalliope门户编目。 文件详解 文件名称:18793.pdf,文件格式:PDF,为文档类文件,可能包含药房历史问卷或相关文字记录...
    packageimg
  • 旺格罗格弗里西亚语语料库

    2025年12月12日 30 99 80

    数据集概述 该数据集为旺格罗格弗里西亚语语料库,包含1807-1935年收集的文本记录及1924-1927年音频转录内容,总文本量约十万五千五百词,覆盖该语言现存主要文献,为研究已消亡的德国北部弗里西亚语言提供数据支持。 文件详解 README.md:Markdown格式文档,介绍语料库核心内容、结构及使用说明...
    packageimg
  • 西班牙锡古恩萨大教堂铭文三维模型数据集

    2025年12月11日 30 203 117

    数据集概述 该数据集包含西班牙锡古恩萨大教堂1507年回廊铭文的三维模型及相关图片。铭文记录了回廊建造背景,三维模型通过Reality Capture和Geomagic Wrap处理生成,为铭文数字化保存与研究提供支持。 文件详解 三维模型文件: 文件名称:fb8ccf5059d34a73807477f03182568b.glb...
    packageimg
  • 德国药房历史问卷与索引卡片原始档案

    2025年12月10日 30 188 88

    数据集概述 本数据集包含德国阿德勒药房(Hindenburg Adler-Apotheke)的历史档案,核心内容为1924至1948年间的问卷、索引卡片及部分附件,记录药房历史相关信息,通过Kalliope门户编目。 文件详解 文件名称:19036.pdf,文件格式:PDF,占比百分之五十,为文档类文件,内容可能包含历史问卷或档案文本...
    packageimg
  • 本斯海姆市场药房历史档案数据集

    2025年12月9日 30 105 3

    数据集概述 该数据集包含德国本斯海姆市场药房的历史档案,核心内容为1924年与1948年的历史问卷、索引卡片及部分附随材料,通过Kalliope门户网站编目,反映药房历史相关信息。 文件详解 文件名称: 08208.pdf,文件格式: PDF 文件名称: 08208.tiff,文件格式: TIFF 数据来源 Kalliope portal 适用场景...
    packageimg