-
Kalasatama_CityJSON_Based语义视图分析3D城市模型数据
数据集概述 本数据集为适用于语义视图分析的CityJSON格式3D城市模型示例,由阿尔托大学2020年生成。模型基于赫尔辛基相关公开数据集转换而来,可通过指定浏览器工具进行语义视图分析,支持3D城市模型的可视化与语义分析研究。 文件详解 文件名称:Kalasatama.json 文件格式:JSON...
-
OBO_Foundry_Snapshot_本体词汇分析数据集_20220316
数据集概述 本数据集为2022年3月16日的OBO Foundry本体快照,用于OBO Foundry本体的词汇分析。包含3个文件,无目录层级,主要文件类型为ZIP压缩包和TSV表格,记录本体版本、候选本体及成员本体信息。 文件详解 candidate_ontologies.zip 文件格式:ZIP 内容说明:候选本体压缩包,包含OBO...
-
Wikidata_embedding_20170613_知识图谱实体关系嵌入模型
数据集概述 本数据集为基于Wikidata 2017年6月13日快照生成的实体嵌入模型,通过CBOW算法训练得到。模型使用Wikidata的三元组关系数据构建训练语料,包含实体和属性的向量表示,可用于知识图谱相关的语义分析任务。 文件详解 文件名称:wikidata-20170613-truthy-BETA-cbow-...
-
NFDI4Culture_Based_文化知识图谱交换格式规范数据_v1_2_1
数据集概述 本数据集为文化知识图谱(Culture Knowledge Graph)联邦数据采集设计的交换格式规范(CGIF)相关数据发布,包含规范的源文件、图表及使用后材料,采用基于schema.org的轻量级格式,支持从数据集合中采集含IRI、名称、日期等受控词汇属性的资源,提升数据可发现性。 文件详解 文件名称:ta5-cgif-...
-
OMOP2OBO_Based_OMOP药物暴露成分与OBO本体映射数据_V1_0
数据集概述 本数据集为OMOP2OBO Drug Exposure Ingredient Mappings V1.0,通过OMOP2OBO算法生成,实现OMOP标准药物暴露成分概念(基于RxNorm)与ChEBI、NCBITaxon、PRO、VO等OBO Foundry本体的映射,含自动(基于TF-IDF嵌入、余弦相似度)及手动映射,支持语义互操作性。...
-
IESO_Based_智能能源系统本体_本地灵活性市场与电力系统联合仿真演示数据
数据集概述 本数据集基于智能能源系统本体(IESO),提供电力能源系统多智能体系统的语义互操作性支持。通过复用现有电力子领域语义模型构建共享词汇,实现语义推理、约束验证与数据标准化。数据集包含联合仿真演示相关文件,展示IESO在农村配电网管理中的应用。 文件详解 文件名称:data.zip 文件格式:ZIP...
-
KitchenOBJs_Based_Wikidata厨房用具子类RDF转储数据集
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,聚焦厨房用具子类,包含4个相关文件,记录数据生成工具版本、转储日期、实体及三元组统计等元信息,以及厨房用具子类的结构化数据规范,为知识图谱构建与语义分析提供基础数据。 文件详解 info.json 文件格式:JSON...
-
Indo_Iranian_Uralic_Based_乌拉尔语系印伊语借词分布数据
数据集概述 本数据集是Grünthal等人2022年论文《Drastic demographic events triggered the Uralic spread》的附录,整理了乌拉尔语系中的早期印伊语借词及其分布情况,数据来源于赫尔辛基大学Samppa Holopainen 2019年博士论文。 文件详解...
-
Neo_Assyrian_Oracc_Based新亚述语料库族名分布模式研究数据
数据集概述 本数据集是论文“Broad-scale patterns in the distribution of ethnic names in the Neo-Assyrian Oracc corpus”的关联表格与列表,包含8个文件,涉及族名分布的语义分析、拼写标准化、文本类型分类等内容,用于支撑新亚述Oracc语料库中族名分布模式的研究。...
-
Wikimedia_Commons_Based_动物单标签分类语义感知图像数据集
数据集概述 本数据集是基于Wikimedia Commons构建的动物单标签分类语义感知图像数据集,包含不同语义粒度的动物图像分类数据,分为Class1、Class2、Class3三个层级,各层级类别数量和图像数量按语义粒度递增/递减,用于评估语义特征对单标签图像分类算法效率的影响。 文件详解 文件名称:Description.txt 文件格式:TXT...
-
气候书籍_如何避免气候灾难_格蕾塔_通贝里与比尔_盖茨著作的修辞框架与主题分析数据
数据集概述 本数据集包含用于分析Greta Thunberg《The Climate Book》与Bill Gates《How to Avoid a Climate Disaster》两本书籍修辞框架的编码及引述内容,通过结构化整理支持对气候议题相关文本修辞策略的研究。 文件详解 文件名称:Codes and Quotes for Analysis...
-
Catalan_Parliamentary_Debate_加泰罗尼亚议会辩论样本数据
数据集概述 本数据集为加泰罗尼亚议会辩论样本,包含2012年12月及2016年1月两次全体就职会议的辩论内容,涉及Artur Mas连任及Carles Puigdemont当选加泰罗尼亚政府主席的相关讨论。数据用于研究议会话语、情态标记使用与意识形态表达的关系,仅含一个文档文件。 文件详解 文件名称:Dataset_ Catalan...
-
Pisgah_Archaeology_密西西比文化Pisgah期陶器残片三维模型数据
数据集概述 本数据集包含一件Pisgah Complicated Stamped风格陶器口沿残片的考古信息与数字资源,残片出土于北卡罗来纳州Swain县Sawnooke遗址,属于密西西比文化Pisgah期(公元1000-1400年),材质为陶瓷,记录有尺寸、馆藏编号及文献引用信息,配套提供数字图像与三维模型文件。 文件详解 图像文件(共5个)...
-
ODDC_探索开放数据对尼日利亚2013年预算社会媒体讨论数据的影响_2014年6月
数据集概述 本数据集为尼日利亚2013年预算相关的社交媒体讨论数据,提取自在线话语内容,是"探索开放数据在发展中国家的新兴影响"(ODDC)研究项目中,尼日利亚在线国家预算使用案例媒体分析的组成部分,包含1个文件。 文件详解 文件名称:Social_Media_Data_June_2014.xlsx 文件格式:XLSX...
-
AnCora_Catalan_Based_加泰罗尼亚语多层面标注语料库_2_0_0版
数据集概述 本数据集为AnCora Catalan 2.0.0加泰罗尼亚语语料库,包含约五十万字,主要基于新闻文本构建。数据在词元与词性、句法成分与功能、论元结构与题元角色、动词语义类、名词WordNet同义词集关联、命名实体及共指关系等多层面进行标注,是自然语言处理研究的基础资源。 文件详解 文件名称:AnCora Catalan 2.0.0.zip...
-
Sensemaking_Online_Post_and_comments_意义构建研究数据
数据集概述 本数据集包含用于研究在线内容意义构建的帖子与评论数据,涉及算法治理引发的宏观危机下微观层面的隐喻意义构建,以及在线劳动中生活体验的细致纹理。数据集共6个文件,涵盖支持脚本、说明文档、隐喻分析文件、帖子评论数据及汇总表等内容。 文件详解 数据文件(.xls/.xlsx格式,共5个)...
-
French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集
数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
-
Edward_FitzGerald_Life_and_Letters_其他兴趣与观点分析数据
数据集概述 本数据集是Edward FitzGerald书信研究档案的一部分,由独立研究者W H (Bill) Martin和Sandra Mason整理,包含基于其书信分析兴趣与观点的结构化数据,涉及时事、宗教、旅行等多个主题,支持对作家多维度思想的研究,总计16个文件。 文件详解 说明文件 文件名称:README...
-
Wikidata_Dump_Based_Wikidata_CC化学化合物列表数据
数据集概述 本数据集是通过wdumps生成的Wikidata RDF转储数据,聚焦于化学化合物列表。包含元数据、规范配置、预览数据及压缩数据等4个文件,可用于获取Wikidata中化学化合物相关的结构化信息,支持数据检索与分析。 文件详解 info.json 文件格式:JSON...
-
OMOP2OBO_Source_OMOP标准测量概念到OBO本体映射数据V1_0
数据集概述 本数据集为OMOP2OBO Measurement Mappings V1.0版本,包含OMOP标准测量概念(基于LOINC)与人类表型本体(HPO)、生物相关化学实体(CheBI)等7种OBO本体的映射关系。映射覆盖测试结果的所有参考范围水平,采用自动(含TF-...



