找到2个数据集

格式: ZIP 标签: 实体频率

过滤结果
  • AI4PROFHEALTH_Based_职业_临床知识图谱数据

    2026年1月29日 30 94 9

    数据集概述 本数据集为职业-临床知识图谱,基于Mesinesp2语料库(含科学文献、临床试验等人工标注内容)和临床病例报告两类语料库中标准化概念的共现关系构建,通过命名实体识别(NER)系统提取疾病、药物等临床相关提及信息,形成职业与健康状态关联的知识图谱资源。 文件详解 README.txt 文件格式:TXT...
    packageimg
  • 瑞士新冠疫情主流媒体词汇与命名实体分析数据集

    2025年12月12日 30 72 62

    数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
    packageimg