数据集 - 海数据

MDA_Based_语义数据生成与领域本体构建流程数据

2026年1月31日 30 145 129

数据集概述本数据集围绕MDA框架下的语义数据生成流程展开，包含从数据需求到语义数据集及领域本体的全流程成果。涉及COVID-19、马德里地铁GTFS、西班牙访客等场景的本体文件、RDF数据集、DSL代码及规则文件，共15个文件，覆盖.txt、.owl、.rdf、.zip四种格式，支持语义数据生成方法的验证与应用。文件详解本体文件（.owl格式）...

ZIP

CafeteriaSA_Based_食品语义资源多标准标注科学摘要数据

2026年1月26日 30 21 0

数据集概述本数据集是欧洲食品安全局（EFSA）资助的CAFETERIA项目成果，包含500篇科学摘要的标注内容，涉及Hansard分类法、FoodOn和SNOMED-CT三种食品语义资源，共标注6,407个食品实体。数据集可支持食品信息提取领域的自然语言处理方法开发，包含4个XML格式文件。文件详解...

ZIP

French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集

2026年1月17日 30 173 8

数据集概述本数据集用于基于Princeton WordNet标识符的法语词义消歧任务，包含两个自动翻译并对齐的训练语料库（SemCor、WordNet Gloss Corpus），以及一个从SemEval 2013任务12转换而来的测试语料库，总计3个XML文件。文件详解训练语料库文件...

ZIP

OMOP2OBO_Source_OMOP标准测量概念到OBO本体映射数据V1_0

2026年1月15日 30 199 161

数据集概述本数据集为OMOP2OBO Measurement Mappings V1.0版本，包含OMOP标准测量概念（基于LOINC）与人类表型本体（HPO）、生物相关化学实体（CheBI）等7种OBO本体的映射关系。映射覆盖测试结果的所有参考范围水平，采用自动（含TF-...

ZIP

JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop

2026年1月5日 30 50 2

数据集概述本数据集是用于分析大语言模型（LLMs）越狱攻击与幻觉模式的基准数据集，包含语义对齐的越狱及事实性提示词，以及毒性变化、相似度得分、标注策略等元数据，支持LLM安全与事实一致性的评估研究。文件详解文件名称：README.md 文件格式：Markdown 字段映射介绍：包含数据集概述、开发背景、使用说明等文档内容...

ZIP

啤酒本体数据集

2025年12月19日 30 50 36

数据集概述该数据集为RDFS/OWL格式的啤酒本体，以中立语言提供啤酒及原料的可追溯性、过程控制和风格识别支持。本体术语标签与描述支持法语和英语，是在线链接开放数据仓库的副本，随新版本同步更新。文件详解文件名称: beer.owl 文件格式: OWL (.owl) 内容说明:...

ZIP

Veritas_Capsule_2_Regime_B_Skeptic_s_Edition_语义重放压力测试_MiniLM_嵌入数据集

2025年12月8日 30 145 10

数据集概述该数据集是Veritas Capsule 2（Regime B怀疑论者版本）的完整内容，是基于冻结模式实现确定性状态对齐的进阶概念验证。包含真实MiniLM句子嵌入（带权重校验和），涵盖基准模式和敌意噪声/漂移模拟结果，触发阈值违规时自动回退至Regime A，同时提供验证脚本和证明报告。文件详解文件名称:...

ZIP

找到7个数据集

注册成功！