-
CultIntSoc_Corpus_Based_1935_1972年双边文化协定文本语料库
数据集概述 本数据集是1935-1972年间签署的双边一般文化协定文本语料库,收录了提交给国际联盟条约处(LTS)或联合国条约处(UNTS)并由其发布的协定文本,共464份,占该时期相关协定总数的约一半。所有文本以英文呈现,可用于国际文化合作领域的文本分析研究。 文件详解 文件名称:CultIntSoc Corpus, LTS+UNTS GCAs...
-
musiXplora_source_Magnus_Hellmer个人档案数据_v0_0_1
数据集概述 本数据集为musiXplora平台收录的历史人物Magnus Hellmer(ID:h2301)的个人档案数据,涵盖其基本信息、家庭关系、职业身份、所属机构、相关文献及活动记录等内容,是研究16-17世纪欧洲音乐手工业与社会人物的参考资料。 文件详解 文件名称:h2301_DE.json 文件格式:JSON...
-
Repertory_Grid_Based_德国政党与政治家纵向评估数据集2011_2012
数据集概述 本数据集包含2011年5月至2012年2月期间从同一受访者收集的10份德国语言的 repertory grid 数据。每个网格结构固定为24个元素(德国政党和政治家)与10个构念,元素及用于激发构念的元素对在所有访谈中保持一致,文件名称编码了采集日期,可通过OpenRepGrid R包导入分析。 文件详解 数据集文件...
-
Global_Wordnet_Conference_30种语言物体命名比较研究数据2025
数据集概述 本数据集是论文“Everybody Likes to Sleep: A Computer-Assisted Comparison of Object Naming Data from 30 Languages”的配套数据与代码,包含30种语言的物体命名数据,用于支持多语言物体命名的计算机辅助比较研究。数据集以压缩包形式提供,无目录层级结构。...
-
Learned_parasite_avoidance_鱼类_吸虫交互宿主个性与感染抗性数据
数据集概述 本数据集来自鱼类-吸虫交互实验,研究海鳟宿主对吸虫寄生虫的习得性回避行为,探索宿主个性、感染抗性与认知能力的关系,验证宿主是否通过关联学习规避寄生虫视觉线索,以及抗性激活对回避行为的影响,含1个数据文件。 文件详解 文件名称:data_Klemme&Karvonen.xlsx 文件格式:XLSX...
-
EvaCRC_Replication_Package_代码审查评论评估研究复现数据2023
数据集概述 本数据集是ESEC/FSE 2023论文《EvaCRC: Evaluating Code Review Comments》的复现包,包含6个文件,覆盖概念模型构建、实验评估等研究内容,支持论文三个研究问题的复现验证,为代码审查评论评估的相关研究提供可复现的原始数据与材料。 文件详解 文档文件 文件名称:README.md 文件格式:MD...
-
IN00619_Translation_DAHRSENA_PARDI_PLATES翻译文档
数据集概述 本数据集为IN00619号文献《DAHRSENA的PARDI PLATES》的翻译文档,核心内容是对该古代文献的文本翻译,为研究相关历史、文化或语言提供基础资料。数据集仅包含一份翻译文件。 文件详解 文件名称:IN00619 translation.docx 文件格式:DOCX 字段映射介绍:文档为《DAHRSENA的PARDI...
-
COCO_LVIS_Open_Images_V4_Based计算机视觉数据集类别映射整合数据
数据集概述 本数据集提供COCO、LVIS、Open Images V4三个计算机视觉数据集的类别映射关系,通过半自动化流程将三类数据集整合为包含1460个唯一类别的集合,并生成每个类别的层级结构。数据集包含5个文件,支持计算机视觉任务中跨数据集的类别统一与分析。 文件详解 coco_classes_map.txt 文件格式:TXT...
-
福岛核污染水排放的国际话语框架_中日双方立场分析及LDA主题聚类完整数据集_2021_24年
数据集概述 本数据集记录2021-2024年中日两国关于福岛核污染水排放的话语内容,来源包括政府声明、官方媒体(如人民日报、朝日新闻、共同社)和社交媒体(如微博、5ch)。通过LDA主题建模和聚类分析,提取关键词、主题聚类、框架模式及频率统计,支持中日话语框架比较与风险沟通研究。 文件详解 文件名称:CN_official.xlsx 文件格式:XLSX...
-
基于语料库的行为特征分析_古希腊形容词_mikrós_和_mégas_语义关系研究_补充材料
数据集概述 本数据集为论文“A corpus-based behavioral profile analysis of polysemy and antonymy: The case of the ancient Greek size adjectives mikrós and...
-
Wikidata_P279_RDF_Based_Wikidata_P279属性RDF数据转储
数据集概述 本数据集是基于wdumps工具生成的Wikidata P279属性相关RDF数据转储,包含4个文件,覆盖JSON、NT、GZ等格式,记录了数据转储的元信息、规范配置及预览数据,可用于知识图谱构建与分析。 文件详解 info.json 文件格式:JSON...
-
Alpenwort_Corpus_奥地利阿尔卑斯俱乐部年鉴数字化标注语料库数据1869_1998
数据集概述 本数据集为奥地利阿尔卑斯俱乐部1869-1998年年鉴(Zeitschrift des Deutschen und Österreichischen Alpenvereins,ZAV)的数字化标注语料库,覆盖阿尔卑斯山脉探索、全球山地研究、环境保护等主题,遵循CLARIN-DARIAH标准添加元数据,助力学术研究。 文件详解...
-
Automatic_Ontology_Population_Results_自动本体填充结果数据
数据集概述 本数据集包含自动本体填充任务的相关结果文件,涉及Boat和RealEstate两个领域的本体生成、结果输出及评估内容,共8个文件,涵盖本体文件、结果文件、评估文件和语料文件等类型,可用于语义分析和本体工程相关研究。 文件详解 本体文件...
-
Atargatis_Temple_Based_杜拉_欧罗普斯阿塔伽蒂斯神庙铭文数据集_不含6号室
数据集概述 本数据集包含杜拉-欧罗普斯阿塔伽蒂斯神庙(不含6号室)的铭文数据,由Al-At(Polonez Bis 1)和IDEA(国际数字杜拉-欧罗普斯档案)两个项目收集,数据已在wikidata.org建模发布,共包含一个文件。 文件详解 文件名称:Temple Atargatis.xlsx 文件格式:XLSX...
-
Media_narratives_discipline_rage_西班牙平等部政策合法性研究数据
数据集概述 本数据集围绕“Media narratives to discipline rage: delegitimizing the policies of Spain's Ministry of Equality”主题,包含一份媒体叙事语料库文件,主要涉及媒体叙事对西班牙平等部政策的影响分析,是研究媒体叙事与政策合法性关系的基础数据。 文件详解...
-
Wikidata_Dump_Items_subclass_of_Entities_RDF转储数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含实体子类相关信息。数据文件总数为4个,包含JSON、NT和GZ格式文件,记录了转储元数据、规格参数及实体相关RDF数据结构信息。 文件详解 文件名称:info.json 文件格式:JSON...
-
Tiefo_D_Lexicon_Based语言词汇表_Daramandugu地区_2021年4月
数据集概述 本数据集为Daramandugu地区Tiefo-D语言的词汇表,需与同作者的《Tiefo-D语法》(DOI:10.5281/zenodo.4715103)及《Tiefo-D文本集》(DOI:10.5281/zenodo.4715132)配合使用,使用说明见语法附录及文本集附录。后续将在密歇根大学图书馆Deep...
-
Spanish_text_corpus_Based_Wikipedia_自然语言处理语言学研究数据
数据集概述 本数据集是从Wikipedia提取的西班牙语文本语料库,适用于自然语言处理(NLP)和语言学研究。提取过程采用特定平台,相关方法在文献中有所记载。数据集包含原始提取结果和经清洗过滤后的句子数据,共2个文件。 文件详解 文件名称:rawdata.dat.zip 文件格式:ZIP(压缩包)...
-
LDAC2024_Supplementary_Material_建筑领域OWL本体构建分析补充数据
数据集概述 本数据集是LDAC2024研讨会论文《How much OWL do you need to know to make sense of building ontologies?》的补充材料,包含论文分析的建筑领域本体文件、识别出的本体结构与模式,以及基于Chowlk符号生成的图形模式库,共28个文件,覆盖.ttl、.rdf等6种格式。...
-
RADx_Data_Hub_Global_Codebook_NIH公共卫生研究数据标准化代码本数据
数据集概述 本数据集为NIH RADx数据中心的全球代码本,包含一套协调统一的通用数据元素(CDEs),旨在支持对RADx数据中心公共卫生研究数据的回顾性协调,确保研究间语义一致性,实现跨研究整合、分析与复用,符合FAIR数据原则。 文件详解 文件名称:RADx_Data_Hub-Global_Codebook (9).xlsx 文件格式:XLSX...



