-
Global_Wordnet_Conference_30种语言物体命名比较研究数据2025
数据集概述 本数据集是论文“Everybody Likes to Sleep: A Computer-Assisted Comparison of Object Naming Data from 30 Languages”的配套数据与代码,包含30种语言的物体命名数据,用于支持多语言物体命名的计算机辅助比较研究。数据集以压缩包形式提供,无目录层级结构。...
-
Bionomia_Based_Naturalis馆藏有齿蜥蜴模式标本采集者与鉴定者关联数据
数据集概述 本数据集为Naturalis Biodiverstity Center馆藏的有齿蜥蜴(鬣蜥科、避役科)模式标本目录关联的采集者与鉴定者数据,包含志愿者通过Bionomia平台标注的归属信息,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data包格式组织,共9个文件。 文件详解...
-
Wikidata_P279_RDF_Based_Wikidata_P279属性RDF数据转储
数据集概述 本数据集是基于wdumps工具生成的Wikidata P279属性相关RDF数据转储,包含4个文件,覆盖JSON、NT、GZ等格式,记录了数据转储的元信息、规范配置及预览数据,可用于知识图谱构建与分析。 文件详解 info.json 文件格式:JSON...
-
Bionomia_Linked_Pselaphaulax属新西兰物种修订标本采集者鉴定者关联数据
数据集概述 本数据集为《Pselaphaulax Reitter属新西兰物种修订》相关的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件。 文件详解 压缩文件(共8个)...
-
曼布里诺数字图书馆_意大利骑士文学系列第13卷第5册_希腊的斯法拉蒙迪_第五部分数字学术版数据资料
数据集概述 本数据集是意大利骑士文学作品《13/5 Sferamundi di Grecia. Quinta parte》的数字学术版本,包含转录及评注的XML-TEI文件、多格式电子书和用于计算分析的纯文本文件,属于Mambrino数字图书馆项目,由维罗纳大学开发,支持古典文学的数字化研究。 文件详解 转录及评注文件...
-
Colexifications_Pain_Disgust_Joy_Interjections_研究数据集
数据集概述 本数据集为研究疼痛、厌恶与喜悦感叹词共现现象的专用数据,包含5个文件,涵盖说明文档、来源信息、核心数据等内容。数据支持语言学领域对感叹词语义关联及跨语言共现模式的分析,文件类型以CSV为主,辅以XLSX格式,无目录层级划分。 文件详解 说明文档文件 文件名称:Ponsonnet IntjColex_read me_250128.csv...
-
美索不达米亚神名Fast_Text_分析数据集2023
数据集概述 本数据集为《美索不达米亚神名的Fast(Text)分析》研究配套数据,包含用于自然语言处理分析的文本、词向量、可视化结果及致谢文件等,支撑相关学术研究成果。 文件详解 README.md:Markdown格式说明文件,介绍数据集背景、来源及使用说明 WordVectors.zip:压缩文件,存储Fast(Text)模型生成的词向量数据...
-
检索与分析Lexibank味觉共指数据及代码
数据集概述 本数据集是研究《Retrieving and analyzing taste colexifications from Lexibank》的配套数据与代码,包含味觉共指分析的相关数据文件、结果图表及运行代码,为复现研究提供支持。 文件详解 文档与说明文件: LICENSE:无格式,可能为数据集使用许可文件...
-
ARASAAC黑白象形图数据集14之2
数据集概述 该数据集是ARASAAC项目的一部分,包含一千张由Sergio Palao创作的黑白象形图。图像内容涵盖多种主题,无明显命名模式,所有文件均为PNG格式,未划分训练/测试集、数据/标签集或原始/处理集,为视觉符号相关研究提供基础素材。 文件详解 核心文件集合:...
-
PropBank数据库与SentenceBERT嵌入数据集
数据集概述 本数据集是包含SentenceBERT嵌入的PropBank数据库,用于论文“CALAMR: Component ALignment for Abstract Meaning Representation”。数据库涵盖角色、角色集等PropBank数据及示例、描述、函数等嵌入信息,支持独立使用或通过zensols.propbankdb...
-
乌兹别克语残奥会相关词汇单位结构特征研究文档
数据集概述 该数据集为单一PDF文档,聚焦乌兹别克语中与残奥会相关的词汇单位,研究其结构特征。文档可能包含残奥会领域专用词汇的形态、构成方式等语言结构分析内容。 文件详解 文件名称: Islomova Maftuna Yusuf qizi.pdf 文件格式: PDF (.pdf) 内容概述:...
-
乌兹别克语与阿拉伯语马匹词汇组对比研究文档
数据集概述 该数据集包含一份文档,核心内容为乌兹别克语与阿拉伯语中“马匹”相关词汇组的对比研究,围绕两种语言中马匹词汇的语义、结构或文化关联展开分析。 文件详解 文件名称:O’rinova Bonu O’tkir qizi.pdf 文件格式:PDF(.pdf)...
-
ARASAAC黑白象形图数据集第9部分
数据集概述 该数据集为ARASAAC项目的黑白象形图资源,包含一千张PNG格式的图片,由Sergio Palao创建,涉及生物、实验、医疗、图像视觉、音频等多领域语义关键词,无目录结构,可直接用于相关研究或应用场景。 文件详解 文件类型:.png格式图片文件,共1000个,占比百分之百...
-
OLOV_VA_SU_V_INGLIZ_VA_O_ZBEK_LINGVOMADANIYATIDA_BINAR_KONSEPTLAR_VA_ULARNING...
数据集概述 该数据集包含一篇PDF格式的文档,核心内容围绕英语和乌兹别克语语言文化中“火与水”这一对二元概念及其象征意义展开研究,为探究不同语言文化背景下二元概念的符号学内涵提供资料支持。 文件详解 文件名称: Axmedov Jahongirbek G’anijon o’g’li.pdf 文件格式: PDF (.pdf) 文件内容:...
-
跨语言共现词数据库CLICS3
数据集概述 该数据集为CLICS3(跨语言共现词数据库第三版),包含跨语言词汇共现现象的相关数据,支持对跨语言多义性的可重复分析,为语言学领域研究词汇语义关联提供数据基础。 文件详解 文件名称: clics3-v1.1.zip 文件格式: ZIP (.zip) 内容说明:...
-
ARASAAC黑白象形图数据集第一部分_共十四部分
数据集概述 本数据集包含由Sergio Palao为ARASAAC创建的黑白象形图,共一千张PNG格式图片,无目录层级结构。图片覆盖信息公告、职业、日期、节日等主题,为图像识别、辅助沟通等场景提供视觉素材。 文件详解 核心文件组:...
-
CLICS_4跨语言共现数据库
数据集概述 本数据集为CLICS 4跨语言共现数据库(版本0.5),是一个改进后的跨语言共现研究数据库。该数据库聚焦于不同语言中词汇共现现象的收集与整理,为跨语言词汇关系、语义演变等研究提供结构化数据支持。 文件详解 文件名称:clics/clics4-v0.5.zip 文件格式:.zip(压缩包) 内容说明:包含CLICS...
-
哈利波特语义数据集及应用
数据集概述 本数据集围绕哈利波特主题构建,包含语义数据集和相关应用文件。数据以压缩包(.zip)和语义网格式(.ttl)存储,为哈利波特相关内容的语义分析与应用开发提供数据支持。 文件详解 tfg.zip:压缩包格式,具体内容未提供预览 datahpmovies.ttl:TTL格式(语义网RDF序列化格式),可能包含哈利波特电影相关的结构化语义数据...
-
GesisDataSeachKG_Based_社会科学数据语义搜索知识图谱完整数据
数据集概述 该数据集是gesisDataSeachKG项目的资源集合,将Gesis Data Search中的11,965个数据集元数据(基于DDI标准)转换为RDF/S模型,包含多语言数据、11个研究组、1966-2023年的发布日期,涵盖33个语义属性和53万条三元组,支持语义搜索功能。 文件详解 文件名称: ddi_metadata_v2.zip...
-
基于地区名称构建词汇语义场数据集
数据集概述 该数据集围绕基于地区名称构建词汇语义场的主题展开,包含一份相关的PDF文档,为研究词汇语义场的构建方法提供基础资料。 文件详解 文件名称:Sobirova Feruza Islomjon qizi.pdf 文件格式:PDF 内容说明:文档围绕“基于地区名称构建词汇语义场”的主题展开,具体内容需查阅文档获取 适用场景...



