-
AmadissigloXX_现代重写数据库_1955
数据集概述 本数据集是AmadissigloXX项目的一部分,聚焦现代对骑士文学及《堂吉诃德》的重写作品,包含 Álvaro Cunqueiro 1955年作品《Merlín e familia i outras historias》的相关数据。数据集通过JSON和XML两种格式,分别提供作品元数据与完整数据库内容,支持骑士文学现代重写研究。 文件详解...
-
Poesía_Twitter_诗歌传播新方式研究数据
数据集概述 本数据集围绕“诗歌与Twitter:尝试诗歌传播新方式”主题,收录了通过Twitter平台传播诗歌的相关内容,包括发布的推文文本及诗歌片段的关联图片,旨在探索社交媒体对诗歌推广的适配性与新路径。 文件详解 文件名称:Releyendo Comienzo + Bukowski.docx 文件格式:DOCX...
-
OHSH文学地理学_文学空间性的可视化与数据重现性研究
数据集概述 本数据集包含复现文章“Visualizing Literary Spatiality”中“Literary Geomorphology”章节可视化内容所需的数据与代码,包括10部小说的文本文件、地貌词素数据表及可视化代码笔记本,共15个文件,用于文学空间性的分析与可视化研究。 文件详解 文本文件(小说文本)...
-
南亚1700_1900年音乐与舞蹈历史与分析的资料来源
数据集概述 本数据集为SHAMSA数据库1.0版的书目元数据,包含约1700至1900年间南亚(以恒河平原为主)北印度音乐与舞蹈相关的300余种核心文献记录,涵盖波斯语、梵语、乌尔都语等多语种文本,部分文献在伦敦国王学院存有数字副本,是研究殖民时期南亚音乐舞蹈文化史的重要资源。 文件详解 文件名称:SHAMSA_MUSTECIO_1.0.xlsx...
-
LSJ_Based_LAGT古希英词典_计算分析用数据
数据集概述 本数据集是基于LSJ词典构建的古希英数字词典,专为古希语文本计算分析设计,支持LAGT数据集相关研究。包含64,774个原始词元、46,693个标准化词元及对应英文释义,附Python查询脚本,适用于离线Python工作流,助力古希腊语料库语义与词汇探索。 文件详解 文件名称:lsj_dictionary_v1_0_0.json...
-
KOLLMEIER_Based汉印佛教词汇比较对照数据
数据集概述 本数据集为汉印佛教词汇比较对照表,聚焦汉语与印度语系佛教词汇的对比研究,包含一份核心文件,可用于语言学、宗教学领域的词汇语义分析与跨语言对比研究。 文件详解 文件名称:KOLLMEIER version 1.xlsx 文件格式:XLSX...
-
ANR_PICCH_殖民时期马赛媒体呈现语料库2022
数据集概述 本数据集是2022年在ANR PICCH项目框架下由Pauline Savéant构建的语料库,由Sophie Gebeil(法国项目负责人)负责。语料库收录了法国视听媒体及网络(含互联网档案馆)中与马赛殖民历史相关的资料,旨在为批判性研究殖民时期马赛的媒体呈现提供结构化数据,包含1个文件。 文件详解...
-
eBL_Based电子巴比伦文学项目楔形文字转写片段数据
数据集概述 本数据集为电子巴比伦文学项目(eBL)的楔形文字转写片段数据,源自同名论文。包含项目介绍文档、结构化转写数据及压缩包,共三个文件,可与GitHub代码库配合使用,用于亚述学楔形文字文献的数字化研究与分析。 文件详解 README.md 文件格式:MD...
-
DBNL_Based荷兰数字化图书OCR与校正文本数据集
数据集概述 本数据集包含荷兰DBNL平台数字化的220本图书的OCR相关数据,涵盖原始OCR输出文本、校正后的TEI格式文本及元数据,共3个文件,用于图书数字化文本的存储与处理。 文件详解 文件名称:Metadata_DBNL_OCR_v1.xlsx 文件格式:XLSX 字段映射介绍:包含数据集的元数据信息,具体字段未提供预览 文件名称:TXT.zip...
-
AED_TEI_Based_埃及长文本词汇排名位置值数据
数据集概述 本数据集包含埃及文本中词汇的排名位置值,仅覆盖超过100个词汇的文本。排名位置值通过词汇频率衡量其在文本内的相关性,为埃及学文本分析提供结构化词汇重要性参考。数据集含2个文件,以AED-TEI数据为基础。 文件详解 文件名称:readme.txt 文件格式:TXT...
-
COM_Based_中国口述记忆概念模型研究论文表格数据
数据集概述 本数据集包含论文"A Conceptual Model of Chinese Oral Memory Based on Digital Humanities"所用的3个表格文件,涉及中国口述记忆概念模型(COM)的项目信息、元数据提取及本体术语表与对应关系,为数字人文领域研究中国口述记忆提供结构化支撑。 文件详解...
-
音乐探索者_延斯_佩德_斯密特_阿雷斯特鲁普人物档案数据
数据集概述 本数据集为Jens Peder Smidt Aarestrup(musiXplora-ID:a1382)的人物档案数据,包含其基本信息、职业背景、活动地点等内容,记录了这位19世纪挪威钢琴制造师与政治家的核心生平信息,数据以JSON格式存储。 文件详解 文件名称:a1382_DE.json 文件格式:JSON...
-
音乐探索者_约翰_克里斯托夫_多纳蒂人物信息数据_原始版
数据集概述 本数据集为musiXplora平台收录的Johann Christoph Donati(ID:d0314)的人物信息数据,包含其基本身份信息、生平时间、职业领域、家庭关系及活动地点等内容,以结构化JSON文件存储,是研究该历史人物的基础资料。 文件详解 文件名称:d0314_DE.json 文件格式:JSON 字段映射介绍:包含以下核心字段...
-
斯卡利特长袍_霍勒斯_哲学_帕多瓦_数字文献学_2022
数据集概述 本数据集是Robert Fuller Murray所著《The Scarlet Gown》第二版中Horace哲学诗歌的XML-TEI标准编码数据,由帕多瓦大学2022年春季Digital Philology课程制作,关联DissGea、MoHu...
-
通用新闻_联合归档_赫恩胡特兄弟会_共同消息_布道文本数据
数据集概述 本数据集为Unitätsarchiv Herrnhut提供的弟兄会《共同消息》(Gemein-Nachrichten)数字化内容,包含约翰尼斯于12月26日以“主将从其居所降临”为主题的布道文本。数据以XML-TEI转录本和标准化文本形式呈现,涵盖原始转录、元数据增强及可用于机器分析的版本。 文件详解 文件名称:00887_01.xml...
-
哈布斯堡国家部长会议记录完整列表数据_1848_1867年
数据集概述 本数据集包含1848至1867年哈布斯堡国家部长会议的完整会议列表,记录了各次会议的议程项目及ISO格式日期,采用TEI listEvent标准建模。数据集共含2个XML文件,可用于研究该时期哈布斯堡国家的行政决策过程与历史事件脉络。 文件详解 会议记录文件...
-
XML_corpus_Based_文学文本XML语料库数据
数据集概述 本数据集为XML格式的文学文本语料库,包含席勒、莱辛、克莱斯特、歌德、蒂克等作家的作品,共56个XML文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理集,所有文件均为XML格式,其中5个含XML元数据。 文件详解 核心文件:...
-
ELTeC_gsw_Based_瑞士德语小说集_公开数据集
数据集概述 本数据集是欧洲文学文本集合(ELTeC)的瑞士德语小说子集,由COST Action "Distant Reading for European Literary History"项目生成,包含100部符合语料库构成标准的瑞士德语小说,采用TEI编码,支持欧洲文学远程阅读研究,总计102个文件。 文件详解 核心数据文件...
-
MHDL_Based_1922电影行业贸易出版物语料库数据
数据集概述 本数据集为1922年电影行业贸易出版物语料库,含23种出版物的DJVU文本文件及相似度分析代码压缩包。聚焦1922年7月电影行业贸易出版物竞争格局,覆盖知名刊物(如Variety)、被遗忘刊物、影迷杂志、技术期刊等,支持研究电影行业贸易出版文化及期刊间差异。 文件详解 文件名称:1922DataFiles.zip 文件格式:ZIP...
-
f1916_musiXplora_Karl_Focht传记数据
数据集概述 本数据集为音乐家Karl Focht(musiXplora-ID: f1916)的传记信息,包含其基本身份信息、生卒年份、活跃时期、职业领域、活动地点及家庭关系等内容,数据以结构化JSON格式存储,可用于音乐史研究及音乐家档案分析。 文件详解 文件名称:f1916_DE.json 文件格式:JSON...



