找到2,287个数据集

标签: 数字人文

过滤结果
  • Porticus_罗马建筑目录数据_200_BCE_400_CE

    2026年2月9日 30 204 41

    数据集概述 本数据集是公元前200年至公元400年罗马城已证实的Porticus建筑目录,按识别信息、日期与位置、形式、功能、古代证词、参考文献、FUR标识(若出现在塞维鲁大理石平面图)七个标题组织,为博士论文中罗马建筑环境中Porticus空间发展研究的原始成果。 文件详解 文件名称:Porticus database table_March...
    packageimg
  • 文学分析_骑士文学重写研究数据

    2026年2月12日 30 99 41

    数据集概述 本数据集是AmadissigloXX项目下的现代骑士文学与《堂吉诃德》重写数据库的一部分,包含贝尼托·佩雷斯·加尔多斯1881年作品《La desheredada》的相关数据,分为JSON和XML两种格式,总计2个文件。 文件详解 JSON文件 文件名称:5127.json 文件格式:JSON...
    packageimg
  • 艺术文化媒体语义网集成评估数据

    2026年2月12日 30 28 10

    数据集概述 本数据集包含对3662个艺术文化相关媒体网站的语义网技术使用水平的详细测量数据,记录了每个网站的关键指标参数及原始数据,是研究论文“Estimation on the Importance of Semantic Web Integration for Art and Culture Related Online Media...
    packageimg
  • APIS_人文学者传记实体关系标注数据集

    2026年2月9日 30 156 19

    数据集概述 本数据集是APIS项目子项目的成果,包含《奥地利传记词典》中151篇人文领域学者(历史学家、图书馆员、教师等)的人工标注传记。通过APIS平台标注建立了实体间关系,可用于网络可视化或统计查询,仅含一个压缩文件。 文件详解 文件名称:apis_dataset_mittelalter.zip 文件格式:ZIP(压缩包)...
    packageimg
  • 数字人文领域专利计量学研究_论文附表数据

    2026年2月9日 30 14 13

    数据集概述 本数据集为论文“A Probe into Patentometrics in Digital Humanities”的附属表格,聚焦数字人文领域的专利计量学研究内容,以结构化表格形式呈现相关研究数据,为该领域的学术分析提供支撑,包含一个文件。 文件详解 文件名称:Table of a Probe into Patentometrics in...
    packageimg
  • APIS丰富版奥地利传记词典JSON序列化数据

    2026年2月1日 30 152 92

    数据集概述 本数据集为奥地利传记词典的增强版JSON序列化数据,由奥地利人物志信息系统(APIS)项目生成。包含约一万九千名1815至1955年间在奥地利有影响且逝世的人物数据,采用内部JSON格式,提供最丰富的可用数据内容。 文件详解 LICENSE 文件格式:无扩展名 字段映射介绍:未提供具体字段信息,推测为数据使用许可说明文档...
    packageimg
  • ItAnt_古意大利语言文献目录_多格式发布数据

    2026年2月9日 30 67 61

    数据集概述 本数据集为古意大利语言文献目录,重点收录ItAnt项目分析的语言相关文献,支持TEI与TTL两种格式。TEI格式兼容EpiDoc标准,TTL格式基于IFLA开发的FRBRoo/LRMoo概念模型映射,与CIDOC CRM协调,提供半正式的书目信息表示。数据集来自意大利MUR资助的PRIN 2017项目,包含2个文件。 文件详解...
    packageimg
  • Reginsmál_诗歌手稿注释与语言学分析数据

    2026年2月9日 30 65 14

    数据集概述 本数据集包含《Reginsmál》诗歌的注释内容,涵盖Codex Regius手稿的摹本、 diplomatic 及标准化注释,同时从语言学角度对文本进行了词形还原和部分语法(如词性)分析。数据集仅含一个XML文件,聚焦诗歌文本的多维度注释与语言特征标注。 文件详解 文件名称:reginsmal.xml 文件格式:XML...
    packageimg
  • HTRD_Based_15世纪德语散文文本重用检测评估数据集

    2026年1月29日 30 74 1

    数据集概述 本数据集为15世纪德语散文文本重用检测(HTRD)的评估集,包含两篇采用TEI标准标注的文本:《科隆荆棘冠》和《科隆圣城编年史》。标注内容涵盖文本重用实例的分类与链接,文本为里普利安方言,存在拼写变体及手写文本识别(HTR)转录错误,适用于历史文本重用检测方法的评估。 文件详解...
    packageimg
  • TextGrid_CC_BY_3_0授权_XML格式语料库数据

    2026年1月28日 30 167 149

    数据集概述 本数据集为XML格式的文本语料库压缩包,所有文本源自TextGrid平台,由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权,相关研究在《席勒-克莱斯特不确定性原理》中被提及,可用于计算机语言学或文本分析相关研究。 文件详解 文件名称:XML.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Andromaque_Tragedie_戏剧作品XML元数据

    2026年2月8日 30 100 60

    数据集概述 本数据集包含戏剧作品《Andromaque Tragédie》的XML格式文件,无额外目录结构或数据拆分,核心为单份戏剧相关元数据文件,可用于戏剧文学的文本分析或元数据研究。 文件详解 核心文件:EMOTHE0719_AndromaqueTragedie.xml 文件格式:XML 内容说明:包含《Andromaque...
    packageimg
  • 普通新闻_赫恩胡特弟兄会_约瑟夫的祈祷布道转录文本_数字化版

    2026年1月29日 30 73 19

    数据集概述 本数据集为赫恩胡特弟兄会《Gemein-Nachrichten》文献的数字化转录内容,包含1765年起延续的弟兄会通讯中约瑟夫在赫恩胡特集会的祷告与讲道文本。数据以XML-TEI格式的多版本转录文件和标准化文本文件呈现,附元数据及注释信息,支持宗教历史研究与文本分析。 文件详解 原始转录XML文件 文件名称:00883_01.xml...
    packageimg
  • musiXplora_Based_Franz_Full个人档案数据

    2026年2月6日 0 134 111

    数据集概述 本数据集为musiXplora平台收录的乐器制作师Franz Full(ID:f1480)的个人档案数据,涵盖其基本信息、职业背景、师承关系、相关文献及数据版本记录,是研究该音乐人物生平及行业关联的结构化资料。 文件详解 文件名称:f1480_DE.json 文件格式:JSON...
    packageimg
  • 推特科学分类学荷兰语气候变化讨论2023年

    2026年2月1日 30 97 18

    数据集概述 本数据集包含适用于荷兰语气候变化推特话语的科学术语分类体系,涵盖科学话语、科学发现、机构与人物、科学挑战四大类荷兰语关键词,用于筛选和分析推特中气候变化与科学知识、权威或怀疑相关的内容,支持数字人文、宗教社会学等领域研究。 文件详解 文件名称:Science_Taxonomy_Dutch_Climate_Twitter_2023.xlsx...
    packageimg
  • PPA_Based_普林斯顿韵律学文献目录数据集

    2026年2月1日 30 4 3

    数据集概述 本数据集基于T. V. F. Brogan 1981年的《English Versification, 1570-1980》目录生成,包含普林斯顿韵律学档案(PPA)相关的文献信息。数据集提供完整目录及两个特定版本,助力学者研究历史语言与诗歌研究的交叉领域,共含3个Excel文件。 文件详解 文件名称:Full_Brogan-...
    packageimg
  • t1042_Owen_Tyddwr_人物档案数据

    2026年2月1日 30 166 102

    数据集概述 本数据集是关于Owen Tyddwr(musiXplora-ID: t1042)的结构化人物信息档案,包含其基本身份信息、职业领域、活动地点、相关文献记录等内容,首次提及时间为1800年,主要涉及弦乐器制作领域,数据集以单个JSON文件呈现。 文件详解 文件名称:t1042_DE.json 文件格式:JSON...
    packageimg
  • DWDS_Based_德语词源词典完整词条列表数据

    2026年1月31日 30 79 44

    数据集概述 本数据集为《德语词源词典》的词条列表,收录约24500个德语词汇,包含每个词汇在数字德语词典(DWDS)中的对应文章URL。该词典由沃尔夫冈·普法伊费尔领导的团队编写,涵盖词汇的年代、起源、亲属关系及词义演变等信息,是德语词源研究的重要参考资料。 文件详解 文件名称:etymwb-headwords.json 文件格式:JSON...
    packageimg
  • ToposText_Based_希腊古典文学地名数据

    2026年1月31日 30 43 7

    数据集概述 本数据集收录了源自古典文学的希腊地名,数据来源为Montanari编写的《布里尔古希腊语词典》(2015年版)及Kiesling等开发的ToposText网站(2019年3.0版本)。数据集仅包含一个文件,无目录结构,未划分训练测试集、数据标签或原始/处理数据,便于直接获取古典文学中的希腊地名信息。 文件详解...
    packageimg
  • ASNC_Based早期爱尔兰词汇表数据库XML档案

    2026年1月31日 30 185 97

    数据集概述 本数据集为早期爱尔兰词汇表数据库的XML档案,包含Sanas Cormaic、O’Mulconry’s Glossary、Dúil Dromma Cetta及短篇文本Loman和Irsan的各版本XML文件,共十八个文件,是研究中世纪爱尔兰文学与文化环境的重要资源。 文件详解 数据文件...
    packageimg
  • DHd_2015_2018年年会机构投稿量统计数据集

    2026年1月31日 30 185 149

    数据集概述 本数据集为2015-2018年DHd年会摘要集的机构投稿量统计结果,基于各年会议摘要集整理而成,包含2015-2018年各机构在不同会议形式(工作坊、报告/小组讨论、海报)的投稿数量,以及汇总统计数据,可用于分析数字人文领域机构参与会议的活跃度。 文件详解 数据文件...
    packageimg