-
维基数量与维基测量数据集
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
沙漠风筝及相关建筑数据集
数据集概述 本数据集包含所有已识别的沙漠风筝的位置信息,以及约百分之十样本的详细形态数据,同时涵盖同一地理区域内其他狩猎相关结构的数据。 文件详解 文档文件: Data description.pdf:PDF格式,解释每个要素类的内容。 数据文件(JSON格式,共6个):...
-
iSamples测试用例导出数据集2024
数据集概述 该数据集为iSamples平台导出的标本元数据记录测试用例,包含三个不同格式的文件,用于测试验证场景,覆盖JSON、Parquet和HTML类型,无目录层级结构,文件类型分布均衡。 文件详解 文件名称: stac.json 文件格式: JSON (.json) 字段映射:...
-
阿拉伯_安达卢西亚音乐歌词数据集
数据集概述 该数据集包含CompMusic项目中阿拉伯-安达卢西亚音乐曲库的歌词,涵盖"Isbahan"、"Maya"等九种 nawbas 类型。歌词以原始阿拉伯文和ALA-LC标准转写的罗马化版本呈现,存储为TSV、JSON格式文件,并关联音频文件及元数据。 文件详解 压缩文件: Sanas_v2.zip: ZIP格式压缩包,包含数据集所有内容...
-
生态系统功能群F1_2永久性低地河流指示分布图
数据集概述 该数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能群F1.2永久性低地河流的指示分布图与描述性资料,涵盖生态特征概要、全球分布模式地图及方法说明,地图标注主要(红色)和次要(黄色)分布区域,适用于区域尺度查询,非精细点位分析。 文件详解 README:无格式文件,说明数据集背景、地图使用规则及IUCN全球生态系统分类参考链接...
-
现代藏文报纸命名实体识别数据集_标注集与指南
数据集概述 本数据集包含现代藏文报纸命名实体识别(NER)的标注集、指南及训练数据,聚焦中国境内当代藏文媒体文本。涵盖17类实体标签、经人工审核的训练数据及原始标注文件,为藏文NER模型开发提供基础资源。 文件详解 标注规范文件: NER for Modern Tibetan-tagset and...
-
加利福尼亚州森林管理优化抵消项目数据库
数据集概述 该数据集为加利福尼亚州森林管理优化(IFM)抵消项目数据库,通过手动转录抵消项目数据报告(OPDRs)创建,包含数字化项目记录、辅助文件、项目特定文件及术语表,以压缩包形式存储。 文件详解 文件名称:forest-offsets-database-v1.0.zip 文件格式:ZIP压缩包 包含内容: 数字化项目记录(CSV与JSON格式)...
-
生态系统功能群TF1_7寒温带与温带泥炭地指示分布图
数据集概述 本数据集包含IUCN全球生态系统分类学(v2.0)中三级生态系统功能群TF1.7寒温带与温带泥炭地的指示分布图及描述性档案,涉及生态特征、分布模式及方法说明,为该类生态系统的分布研究提供数据支持。 文件详解 README: 无格式文件,包含数据集背景、地图使用说明及IUCN分类链接等基本信息。...
-
犹太企业_Gorbatschow_Liköre_F_Kramer_Co_的维基数据对象数据集
数据集概述 本数据集为犹太企业"Gorbatschow Liköre F. Kramer & Co"的维基数据对象示例,记录了该企业的核心属性信息,包括所有权、时间节点及来源等,基于维基数据条目构建,是历史研究中开放数据管理的实践案例。 文件详解 ReadMe.md:Markdown格式文档,由Sophie...
-
室温测量数据集20250801_20250807
数据集概述 该数据集包含2025年8月1日至7日的每小时室温测量数据,数据通过模拟生成,采用含随机噪声的正弦变化模式,为数据管理培训项目提供虚构实验数据,包含原始数据、处理后数据、分析脚本及相关文档。 文件详解 该数据集包含多个类型文件,具体说明如下: - 原始数据文件: -...
-
研究机构注册库数据转储_1_70版
数据集概述 该数据集是Research Organization Registry(ROR)的公开数据转储,包含118,548个研究机构的ROR标识符及元数据,支持JSON和CSV两种格式,覆盖schema v1和v2两个版本,新增177条记录并更新346条现有记录元数据。 文件详解 文件名称: v1.70-2025-08-26-ror-...
-
格拉茨合成临床文本受保护健康信息标注数据集
数据集概述 该数据集包含人工生成的德语半结构化与非结构化临床摘要,附有用INCEpTION平台标注的受保护健康信息(PHI),含标注文件、类型系统及指南文档,为临床文本去标识研究提供支持。 文件详解 标注文件: grascco_phi_annotation_json.zip: ZIP格式,包含JSON格式的PHI标注数据...
-
声学超材料数据集HA30K
数据集概述 该数据集为声学超材料相关研究提供支持,对应论文《Generative Models for Helmholtz Equation Solutions: A Dataset of Acoustic Materials》,包含训练和测试所需的提示文件及对应源图与目标文件,以压缩包形式存储。 文件详解 该数据集以压缩包形式提供,内部目录结构如下:...
-
天然产物图谱_数据下载
数据集概述 该数据集为天然产物图谱(npatlas.org)的下载数据,包含微生物来源天然产物的核心信息,涵盖分子结构、理化性质等内容,支持天然产物研究与开发。 文件详解 主数据文件(2024_09版本): np_atlas_2024_09.json:JSON格式,包含天然产物核心数据及本体论信息...
-
西班牙PM10空气颗粒物AmIAire数据库2025
数据集概述 该数据集为西班牙PM10空气颗粒物AmIAire数据库,涵盖2025年2月1日至6月6日的PM10浓度数据,包含采样地点、时间、浓度值及对应数据来源照片,信息结构以JSON格式提供。 文件详解 文件名称: db_structure.png 文件格式: PNG (.png) 文件内容:...
-
Intensivregister_Deutschland_Based_德国ICU能力与COVID病床占用完整数据
数据集概述 该数据集包含德国约1300家医院的重症监护治疗能力、病床容量及COVID-19重症患者病例数的实时数据,支持区域和时间维度的医疗资源紧张情况分析,为医疗决策和资源协调提供数据基础。 文件详解 区域层级数据文件:...
-
荷兰航道信息系统拓扑网络数据集
数据集概述 本数据集是基于荷兰航道信息系统(Dutch Fairway Information System)处理得到的拓扑航道网络,覆盖莱茵河走廊(鹿特丹至巴塞尔段),网络结构连通,适用于交通网络分析。 文件详解 网络核心文件(莱茵河走廊,鹿特丹至巴塞尔段):...
-
自动驾驶相关开源项目SBOM数据集2025
数据集概述 本数据集包含2025年2月25日从530个公共GitHub仓库源代码生成的SPDX兼容软件物料清单(SBOMs),聚焦自动驾驶相关软件,采用与Kochanthara等人编译汽车软件数据集相似的方法,为自动驾驶软件供应链分析提供数据支持。 文件详解 文件名称: autopilot_sbom_data.zip 文件格式: ZIP (.zip)...
-
OBSEA海洋观测站SBE37SI校准CTD数据集20250122_20250211
数据集概述 本数据集包含地中海西北部OBSEA水下观测站(20米深度)SBE37SI传感器采集的校准CTD数据,数据经Ifremer计量实验室校准,通过SensorML不确定性分析工具处理,补充了不确定性信息,并附带JSON格式的可机读SensorML校准描述。 文件详解...
-
订单管理对象中心事件日志_OCEL2_0标准
数据集概述 本数据集是遵循OCEL 2.0标准的人工订单管理事件日志,通过CPN-Tools模拟生成,包含客户订单注册、支付、包装、运输等全流程事件,涉及销售、仓储、运输部门员工操作,记录事件类型、对象类型及对象关系等核心信息。 文件详解 文件名称: order-management.json:JSON格式文件,可能包含OCEL...



