-
MatText_Package_分词器词汇表数据
2026年2月1日 30 158 81
数据集概述 本数据集包含MatText软件包分词器使用的词汇表文件,共15个文件,分为JSON和TXT两种格式。文件涵盖材料科学相关的多种词汇类型,如晶体学信息文件(CIF)、SMILES表达式、化学组成等词汇表,为材料文本处理任务提供基础分词资源。 文件详解 JSON文件(8个,占比约53.33%)...
-
FOXDEN_Based实验数据集元数据2024
2026年2月1日 30 31 6
数据集概述 本数据集为FOXDEN数据集,包含2024年3周期的实验元数据,主要记录了beamline(光束线)和type(类型)信息,以JSON格式存储,用于实验数据的基本信息记录与管理。 文件详解 foxden-meta.json 文件格式:JSON...
-
Sample_burst_dict_CT医学实验样本数据
2026年1月30日 0 13 11
数据集概述 本数据集为CT医学实验相关的样本突发字典数据,包含一个JSON格式文件,核心内容是10个以ID命名的键值对集合,无明确数据拆分结构,主要用于CT实验样本的信息记录与管理。 文件详解 文件名称:sample_burst_dict.json 文件格式:JSON...
-
iSamples测试用例导出数据集2024
2025年12月10日 30 55 41
数据集概述 该数据集为iSamples平台导出的标本元数据记录测试用例,包含三个不同格式的文件,用于测试验证场景,覆盖JSON、Parquet和HTML类型,无目录层级结构,文件类型分布均衡。 文件详解 文件名称: stac.json 文件格式: JSON (.json) 字段映射:...



