-
LLM自由联想规范数据集
数据集概述 本数据集是由大型语言模型(LLM)生成的英文自由联想规范集合,包含Mistral、LLaMA3和Claude Haiku模型的输出数据。数据集基于人类生成的“Small World of Words”(SWOW)规范构建,旨在通过与人类语义记忆研究一致的方法,探究LLM的语义记忆特征及与人类的异同。 文件详解 文件名称: LWOW.zip...
-
圣加仑市书信往来数据集2025_08
数据集概述 本数据集是圣加仑市书信往来的数字化版本,收录了1400年至1650年间寄往帝国城市圣加仑的书信原文及图像资料。数据由圣加仑市档案馆与瓦迪尼收藏馆联合发起的长期项目整理,为相关研究领域提供未公开的历史通信源数据。 文件详解 文件名称: Briefverkehr-der-Stadt-St-Gallen/sg-missiven-...
-
伊朗_Kayhan_报JCPOA新闻翻译话语链结构分析数据集
数据集概述 本数据集聚焦伊朗《Kayhan》报在JCPOA后时代发布的560篇相关新闻翻译文本,包含从英、法、德、阿、俄等语言译入波斯语的话语片段,共编码1324条话语链,用于话语链的结构及历时分析,突出报纸编辑把关下的信息选择性使用。 文件详解 文件名称: Dataset for Diachronic and Structural Analysis...
-
德国汉堡布拉姆费尔德药房历史档案数据集1924_1948
数据集概述 该数据集包含德国汉堡布拉姆费尔德药房的历史档案,主要内容为1924至1948年间的历史问卷、索引卡片及部分附随材料。数据通过Kalliope门户网站编目,为研究该药房的发展历程提供原始资料支持。 文件详解 73014.tiff:TIFF格式图像文件,可能为历史档案的扫描件...
-
DEMOTEC项目参与式预算实验话语数据集
数据集概述 本数据集为DEMOTEC项目产出,包含欧洲7国地方层面参与式预算(PB)模拟实验的话语数据,通过编码参与者在实验中的发言,反映其对不同PB形式的偏好,附方法论详情的代码手册。 文件详解...
-
英语历时词用法图数据集_DWUG_EN
数据集概述 该数据集包含英语的历时词用法图(WUGs),记录词汇用法随时间的变化。数据格式、处理代码及更多相关资源可通过WUGsite获取,为研究词汇语义演变提供支持。 文件详解 文件名称:dwug_en.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含英语历时词用法图的相关数据,具体文件结构与字段信息需解压后查看,未提供预览内容 适用场景...
-
柏林恩格尔药房历史档案1924_1948
数据集概述 该数据集包含德国柏林恩格尔药房的历史档案,主要为1924年和1948年的历史问卷、索引卡片及部分公开附录材料,记录药房历史,通过Kalliope门户网站编目。 文件详解 文件名称: 08245.pdf,文件格式: PDF,为文档类文件,内容可能包含历史问卷、索引卡片或附录的数字化文本/图像 文件名称: 08245.tiff,文件格式:...
-
IANUS媒体小组参与者访谈摘录_翻译与匿名材料
数据集概述 本数据集包含对德国科学与政治记者深度访谈的匿名摘录,由Dana Mahr翻译成英文。内容聚焦记者对科学信任的认知演变、科学传播政治化、危机语境下的情绪化话语及极化媒体生态中的日常工作现实,覆盖多类型媒体视角。 文件详解 文件名称: interview-journalist_DM_ENG_ano.pdf 文件格式: PDF (.pdf)...
-
菲特拉特作品中表达社会政治关系的复合词汇数据集
数据集概述 本数据集围绕菲特拉特作品中使用的复合词汇展开研究,重点分析其作为表达社会政治关系的语义词汇群体的特征,为理解相关文本的社会政治内涵提供数据支持。 文件详解 文件名称:Mirzatillayeva Sayyoraxon Zokirjon qizi.pdf 文件格式:PDF...
-
Objaverse_Al_Adziim_Based_壮丽至高阿拉伯语词汇多媒体完整数据
数据集概述 该数据集包含与“Al Adziim(العَظِيمُ)”相关的文件,涉及阿拉伯语词汇及对应英文释义“The Magnificent, The Supreme”,以图片和三维模型文件形式呈现。 文件详解 文件名称及格式: 768d8098ac1642c3b68bec1b2c4e04be.glb:GLB格式三维模型文件...
-
德国阿德勒药房历史档案数据集1924_1948
数据集概述 本数据集包含1924年至1948年关于德国阿德勒药房历史的档案材料,主要为历史问卷、索引卡片及部分相关附件。数据通过Kalliope门户网站进行编目,为研究该药房的历史沿革提供原始资料支持。 文件详解 文件名称: 18352.tiff 文件格式: TIFF (.tiff) 内容说明:...
-
中世纪卢德塞如尼日历数据集
数据集概述 该数据集为中世纪卢德塞如尼日历的数字化数据,包含通过RealityCapture软件处理的图像与模型文件,呈现中世纪如尼日历的视觉信息,为研究中世纪如尼文化提供数据支持。 文件详解...
-
德国霍赫斯特药房历史档案1924_1948
数据集概述 本数据集包含德国霍赫斯特药房1924-1948年间的历史问卷、索引卡片及部分附属材料,记录该药房发展历程。数据通过Kalliope门户编目,包含PDF和TIFF格式文件,为研究药房历史提供原始资料支持。 文件详解 文件名称:73073.pdf 文件格式:PDF 内容说明:可能为药房历史问卷或相关文档的数字化版本...
-
中文情态动词使用数据集
数据集概述 本数据集围绕中文情态动词的使用展开,包含一份PDF格式的文档文件,为研究中文情态动词的语法特征、使用规律及语用功能提供基础资料。 文件详解 文件名称: Aliyeva Diyoraxon Xoshimjon qizi.pdf 文件格式: PDF(.pdf) 内容说明: 文档聚焦中文情态动词的使用主题,具体字段或内容需通过阅读文档获取...
-
科隆_米尔海姆阿德勒药房历史档案数据集1924_1948
数据集概述 本数据集包含德国科隆-米尔海姆地区阿德勒药房的历史档案资料,核心内容为1924至1948年间的历史问卷、索引卡片及部分相关附件,通过Kalliope门户网站进行编目,为研究该药房的发展历程提供历史文献支持。 文件详解 文件名称: 19358.pdf:PDF格式文档文件,可能包含药房历史问卷或相关文本档案的扫描件 文件名称:...
-
HIPE_2022共享任务命名实体数据集
数据集概述 本数据集是HIPE-2022共享任务的专用数据,用于多语言历史文档中的命名实体识别与分类(NERC)及实体链接(EL)任务。基于六个原始数据集构建,涵盖约两百年的历史报纸和经典评注,包含多种语言和实体标注方案。 文件详解 文件名称: HIPE-2022-data-2.1-test-all-unmasked.zip 文件格式: ZIP压缩包...
-
德国Cossebaude_Wettin药房历史文献集1924_1948
数据集概述 本数据集收录了德国Cossebaude Wettin药房的历史文献,包括1924年至1948年的历史问卷、索引卡片及部分精选附件,通过Kalliope门户网站进行编目,为研究该药房的历史发展提供原始资料支持。 文件详解 文件名称: 70501.tiff:TIFF格式文件,属于栅格图像文件,可能包含药房历史文献的扫描图像 文件名称:...
-
欧洲语言社会科学叙词表2024
数据集概述 该数据集为欧洲语言社会科学叙词表(ELSST),覆盖政治学、社会学等十余门核心社会科学学科,包含约三千四百个概念,由欧洲社会科学数据档案联盟及其服务提供商发布,用于跨语言、跨资源的数据发现与访问。 文件详解 文件名称:ELSST_R5.ttl,格式:TTL,RDF三元组格式的叙词表数据文件...
-
重定向图与身份图URI分析数据集
数据集概述 该数据集聚焦LOD云(链接开放数据云)中统一资源标识符(URI)的重定向关系,基于2015年语义网爬取的sameAs.cc身份图实体,包含四组抽样实体的重定向关系数据,支持重定向语义、实体演化及重定向图属性的分析研究。 文件详解 数据文件(TSV格式):...
-
英语和乌兹别克语中表达_嘴_概念的工具性名词场研究
数据集概述 该数据集包含一篇关于英语和乌兹别克语中表达“嘴”概念的工具性名词场的研究文档,聚焦两种语言中相关概念的词汇表达体系,为对比语言学研究提供资料支持。 文件详解 文件名称: Botirbek Otajonov.pdf 文件格式: PDF (.pdf) 文件内容:...



