-
基于语言规范主义的荷兰语历史社会语言学研究数据集_2023年
2026年1月29日 30 31 6
数据集概述 本数据集为《Routledge手册:语言规定主义》中相关章节的配套数据,聚焦1550–1850年荷兰南北地区荷兰语的两个语言特征:闭音节中长/a/的拼写、d-词干动词词尾/t/的拼写。包含规范性数据(语法学家的显性/隐性规定及元数据)和使用数据(荷兰语历史语料库的观察数据),共4个文件。 文件详解...
-
C_CLAMP_Based_荷兰语医疗CT_veel偏转数据集
2026年1月29日 30 6 3
数据集概述 本数据集基于C-CLAMP语料库构建,以荷兰语记录veel的偏转相关信息,核心围绕医疗CT领域的veel偏转主题。数据集仅包含一个文件,无目录结构,未进行训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称:The deflection of veel.xlsx 文件格式:XLSX...
-
Objaverse_The_Netherlands地理与行政区划数据
2026年1月27日 30 62 58
数据集概述 本数据集提供荷兰的地理与行政区划相关信息,包括荷兰在西欧的地理位置、与德国、比利时等国的边界,以及加勒比地区的海外领土构成,同时提及荷兰的官方语言为荷兰语。数据集包含图片和模型文件,可用于了解荷兰的基本地理与行政情况。 文件详解 图片文件(.jpeg格式)...
-
Phenopackets_Based_多语言基因医学案例集_自动更新版
2026年1月26日 30 1 0
数据集概述 本数据集包含基于Phenopackets生成的多语言基因医学案例集,支持捷克语、中文、荷兰语、英语、德语、意大利语、日语、西班牙语和土耳其语共9种语言,用于LLM研究,会随Phenopacket Store更新自动同步最新HPO翻译和案例数据。 文件详解 压缩文件(ZIP)...
-
EASIN_GBIF_Based_比利时外来陆生软体动物登记清单数据
2026年1月25日 30 128 40
数据集概述 本数据集是比利时外来陆生软体动物登记清单,由比利时皇家自然科学研究所的Thierry Backeljau维护,包含1800年以来比利时野外发现的29种非本地陆生软体动物信息,基于文献调查和RBINS内部信息编制,可用于外来软体动物研究与管理或区域/国家外来物种登记编制。 文件详解 alien_mollusca_checklist.xlsx...
-
Common_Voice_11_0_Spoken_NER_Dataset
2026年1月22日 30 87 86
数据集概述 本数据集是基于Common Voice 11.0构建的口语命名实体识别(Spoken NER)数据集,包含荷兰语、英语和德语三种语言的口语命名实体识别数据,共3个JSON格式文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 荷兰语口语命名实体识别数据文件 文件名称:cv_nl_dataset.json...
-
AuCoPro_Semantics_Based_复合词语义自动分析数据集
2026年1月22日 30 56 0
数据集概述 本数据集用于复合词的自动语义分析,包含荷兰语和南非荷兰语的语义标注名词-名词复合词(NN),每种语言分两轮标注,标注指南基于Ó Séaghdha(2008)的标准;还包含荷兰语其他名词性复合词(XN),采用新开发的标注方案。数据集以压缩包形式提供,共1个文件。 文件详解 文件名称:AUCOPRO.Semantics.zip 文件格式:ZIP...
-
Qualitative_Interview_Data_肌电上肢假肢用户与治疗师感知访谈数据_公开版
2026年1月7日 30 89 77
数据集概述 本数据集为2016-2017年通过半结构化访谈收集的定性数据,访谈对象包括肌电多功能上肢假肢用户及治疗师,核心内容为用户对假肢设备的满意度及使用假肢完成的活动。访谈语言为荷兰语和德语,共包含十八份文件,其中四位有模式识别控制经验用户的数据未公开。 文件详解 访谈文档 文件名称:包含Interview 2.docx、Interview...
-
Flemish_Archaeological_Texts_佛兰芒地区考古文献量化研究数据_2017
2026年1月7日 30 201 17
数据集概述 本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。 文件详解 METADATA.xlsx 文件格式:XLSX...
-
Multilingual_Dynamics_Based_中世纪佛兰德斯多语言文学手稿元数据_2024版
2026年1月2日 30 95 68
数据集概述 本数据集是“中世纪佛兰德斯多语言文学动态”项目的一部分,包含2539份现存中世纪佛兰德斯手稿(约1200-1500年)的元数据,涵盖荷兰语、法语和拉丁语文学文本,涉及手稿的基本信息、文本特征、来源、抄本学、装饰和书写体等6类主题,为研究该地区多语言文学文化的生产与接受提供基础数据。 文件详解 文件名称:Dataset...
-
Historical_Corpus_of_Dutch_Based荷兰语历史时期动词簇语序变异研究数据集
2026年1月2日 30 128 9
数据集概述 本数据集为荷兰语历史动词簇语序变异研究的核心数据,包含对早期至晚期近代荷兰语中动词簇语序变异的影响因素分析数据,涉及社会语言学变量(时间、地域、文本体裁)与结构变量(过去分词形态、助动词类型等),支持相关语言学研究。 文件详解 文件名称:data_volgordevariatie_BTFG.xlsx 文件格式:XLSX...
-
KBNL03000040140_Entangled_Histories_乌得勒支地区公告集转录数据1856
2025年12月31日 30 11 5
数据集概述 本数据集为《Mr. Johan van de Water's Groot plakkaatboek 'slands van...
-
沿海环境享受_访问时长与健康关系研究数据集
2025年12月18日 30 141 7
数据集概述 本数据集围绕沿海环境享受、连接感与游客心理健康、感知健康结果的关系展开,探究日常访问时长和停留访问时长是否对上述关系存在调节作用。包含调查数据、代码本、分析代码及多语言调查文档,为相关研究提供支持。 文件详解 该数据集包含六个文件,具体说明如下: - 代码文件: - Coastal environment enjoyment,...
-
数据15世纪中荷兰语祈祷书与微型画数据集
2025年12月15日 30 7 2
数据集概述 该数据集包含15世纪中荷兰语祈祷书及其微型画的数字化内容,涵盖三维模型文件与预览图片,为研究中世纪祈祷书的艺术风格与内容提供视觉化数据支持。 文件详解 三维模型文件: daa90ac002ec4edb86d76489a7122bdb.glb: GLB格式三维模型文件,记录祈祷书的三维数字化信息 预览图片文件:...
-
法语和荷兰语系动词结构行为特征分析复现数据集
2025年12月11日 30 162 14
数据集概述 本数据集是研究法语和荷兰语系动词(含半系动词)结构行为特征分析的复现数据,包含原始研究的核心数据文件、分析代码及说明文档,可支持相关研究结果的重复验证与扩展分析。 文件详解 数据文件: 01a_Final_dataset_prototypical_copularity.xlsx:Excel格式,包含原型系动词性的最终数据集...
-
ICDAR2003非正式在线单词识别竞赛数据集_Unipen_ICROW_03基准集_V0_0
2025年12月9日 30 129 68
数据集概述 本数据集是ICDAR2003非正式在线单词识别竞赛的基准集,包含来自不同平板设备、国籍和语言的孤立在线自由手写(手写体、混合体、草书)单词数据,支持ASCII字符集标签,可用于评估“即学即用”识别性能。 文件详解 文件名称: _README.txt 文件格式: TXT 内容:...
-
多语言合成出院小结数据集_基于心力衰竭临床病例
2025年12月6日 30 41 0
数据集概述 该数据集包含一千份心脏病学临床病例报告及其对应的多语言合成出院小结,覆盖英语、西班牙语和荷兰语三种语言。小结由GPT-4o-mini通过零样本提示生成并翻译,旨在为临床自然语言处理系统提供训练与评估数据支持。 文件详解 根目录文件: MultiSynDS.zip: 压缩文件,包含数据集所有内容 子目录结构:...
-
NIOD战争信件手写文本识别模型数据集1935_1950
2025年12月6日 30 151 37
数据集概述 本数据集包含基于荷兰NIOD研究所1935-1950年战争信件档案训练的手写文本识别(HTR)模型,训练数据来自968份荷兰语手写信件的真实转录文本,涵盖儿童、士兵等多群体的私人通信,为手写历史文献数字化提供技术支持。 文件详解 文件名称: Examples_HTR_Model.zip 文件格式: ZIP 内容说明:...



