找到7个数据集

标签: 语义对齐

过滤结果
  • MDA_Based_语义数据生成与领域本体构建流程数据

    2026年1月31日 30 145 129

    数据集概述 本数据集围绕MDA框架下的语义数据生成流程展开,包含从数据需求到语义数据集及领域本体的全流程成果。涉及COVID-19、马德里地铁GTFS、西班牙访客等场景的本体文件、RDF数据集、DSL代码及规则文件,共15个文件,覆盖.txt、.owl、.rdf、.zip四种格式,支持语义数据生成方法的验证与应用。 文件详解 本体文件(.owl格式)...
    packageimg
  • CafeteriaSA_Based_食品语义资源多标准标注科学摘要数据

    2026年1月26日 30 21 0

    数据集概述 本数据集是欧洲食品安全局(EFSA)资助的CAFETERIA项目成果,包含500篇科学摘要的标注内容,涉及Hansard分类法、FoodOn和SNOMED-CT三种食品语义资源,共标注6,407个食品实体。数据集可支持食品信息提取领域的自然语言处理方法开发,包含4个XML格式文件。 文件详解...
    packageimg
  • French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集

    2026年1月17日 30 173 8

    数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
    packageimg
  • OMOP2OBO_Source_OMOP标准测量概念到OBO本体映射数据V1_0

    2026年1月15日 30 199 161

    数据集概述 本数据集为OMOP2OBO Measurement Mappings V1.0版本,包含OMOP标准测量概念(基于LOINC)与人类表型本体(HPO)、生物相关化学实体(CheBI)等7种OBO本体的映射关系。映射覆盖测试结果的所有参考范围水平,采用自动(含TF-...
    packageimg
  • JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop

    2026年1月5日 30 50 2

    数据集概述 本数据集是用于分析大语言模型(LLMs)越狱攻击与幻觉模式的基准数据集,包含语义对齐的越狱及事实性提示词,以及毒性变化、相似度得分、标注策略等元数据,支持LLM安全与事实一致性的评估研究。 文件详解 文件名称:README.md 文件格式:Markdown 字段映射介绍:包含数据集概述、开发背景、使用说明等文档内容...
    packageimg
  • 啤酒本体数据集

    2025年12月19日 30 50 36

    数据集概述 该数据集为RDFS/OWL格式的啤酒本体,以中立语言提供啤酒及原料的可追溯性、过程控制和风格识别支持。本体术语标签与描述支持法语和英语,是在线链接开放数据仓库的副本,随新版本同步更新。 文件详解 文件名称: beer.owl 文件格式: OWL (.owl) 内容说明:...
    packageimg
  • Veritas_Capsule_2_Regime_B_Skeptic_s_Edition_语义重放压力测试_MiniLM_嵌入数据集

    2025年12月8日 30 145 10

    数据集概述 该数据集是Veritas Capsule 2(Regime B怀疑论者版本)的完整内容,是基于冻结模式实现确定性状态对齐的进阶概念验证。包含真实MiniLM句子嵌入(带权重校验和),涵盖基准模式和敌意噪声/漂移模拟结果,触发阈值违规时自动回退至Regime A,同时提供验证脚本和证明报告。 文件详解 文件名称:...
    packageimg