找到96个数据集

标签: 关系抽取

过滤结果
  • 荷兰传记门户_生物信息_关系抽取_标注数据集

    2026年2月1日 30 202 38

    数据集概述 本数据集为荷兰传记文本的人工标注关系抽取数据集,包含14类生物信息相关关系,如出生时间、居住地、亲属关系等。数据源自荷兰传记门户,包含测试集数据及说明文档,共2个文件,用于自然语言处理领域的关系抽取任务研究。 文件详解 README.md 文件格式:.md...
    packageimg
  • Vicuna_Based_生物与天然产物端到端关系抽取合成数据集

    2026年2月9日 30 40 0

    数据集概述 本数据集是用于生物与天然产物之间关系端到端抽取的合成训练/验证数据,基于Vicuna-13b-v1.5模型生成,源自LLaMA 2。数据依托GME-sampler提取的生物界前1000篇LOTUS文献参考构建,包含训练集10405项、验证集547项,遵循相关文章所述协议生成。 文件详解 训练集文件 文件名称:train.json...
    packageimg
  • HTI_Based_草药靶点相互作用关系抽取数据集

    2026年1月31日 30 120 19

    数据集概述 本数据集为草药靶点相互作用(HTI)关系抽取数据集,包含中文与英文两种语言的草药靶点相关数据及摘要文件,涉及草药治疗疾病的临床应用、靶点蛋白关联等信息,可用于草药与靶点相互作用的关系挖掘研究,总计包含4个文件。 文件详解 HTI_abstracts_cn.json 文件格式:JSON...
    packageimg
  • 黑客马拉松_TF_TG_关系_注释_黄金标准语料库

    2026年1月31日 30 116 44

    数据集概述 本数据集为TF-TG关系标注黄金标准语料库,包含130个PMID对应的生物医学文献标注数据,以ZIP压缩包形式存储。数据用于基因调控领域的文本标注研究,提供原始摘要文本与BRAT格式的术语及关系标注文件,支持生物医学文本挖掘相关分析。 文件详解 压缩包文件 文件名称:TFTG_V3.zip 文件格式:ZIP...
    packageimg
  • DBGI_KG_Based热带植物知识图谱玩具数据集v0_4

    2026年1月29日 30 49 19

    数据集概述 本数据集是Digital Botanical Gardens Initiative Knowledge Graph(DBGI-KG)的热带植物知识图谱玩具数据集,用于知识图谱相关任务的测试与验证。数据集为简化压缩包格式,无训练/测试、数据/标签或原始/处理数据划分,仅包含一个压缩文件。 文件详解 压缩文件...
    packageimg
  • BioEsCorpus_西班牙语临床报告生物医学实体关系注释语料库

    2026年1月27日 30 59 32

    数据集概述 本数据集包含对西班牙临床案例语料库(SPACCC)中18份西班牙语临床报告进行生物医学实体与语义关系标注的文件及资源。标注涵盖11类实体和8类语义关系,最终识别出324个实体(涉及10类实体)和170条关系(涉及5类关系),为生物医学文本处理研究提供结构化标注资源。 文件详解 brat_annotations目录...
    packageimg
  • CT_EBM_SP_Based_西班牙循证医学临床试验标注语料数据

    2026年1月27日 30 14 2

    数据集概述 本数据集为西班牙循证医学临床试验语料库(CT-EBM-SP),包含一千二百篇西班牙语临床试验相关文本(共二十九万二千一百七十三个词元),涵盖五百篇期刊摘要及七百篇临床试验公告,标注有解剖学、药理化学物质等四类医学实体,适用于医学自然语言处理研究。 文件详解 文件名称:CT-EBM-SP.zip 文件格式:ZIP...
    packageimg
  • Bangla_REX_Based_孟加拉语关系抽取数据集_完整标注版

    2026年1月23日 30 39 28

    数据集概述 本数据集是针对孟加拉语关系抽取任务构建的专用数据集,基于结构化知识库和标注语料的理论框架生成。包含63,256条条目组成的孟加拉语知识库(KB)、90,441条带命名实体识别(NER)和词性标注(POS)的文本语料,以及440个孟加拉语地点助记符,可直接用于关系抽取任务。 文件详解 location_mnemonics.xlsx...
    packageimg
  • Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

    2026年1月11日 30 60 4

    数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...
    packageimg
  • WD4P_多标注模式知识图谱链接预测基准数据集

    2025年12月18日 30 106 25

    数据集概述 该数据集是基于Wikidata构建的多标注模式知识图谱链接预测基准,包含基础三元组(s-p-o)及三种标注模式(t-p-o、s-p-t、t-p-t),由WD50K和FBHE数据集整合而来,适用于知识图谱链接预测任务的模型评估。 文件详解 文件名称:wd4p.zip:压缩格式,包含完整的WD4P基准数据集,涵盖所有四种标注模式的知识图谱数据...
    packageimg
  • 法国建筑技术规范木工条款命名实体识别与关系抽取标注数据集

    2025年12月15日 30 137 36

    数据集概述 本数据集包含从法国建筑技术规范(CCTP)中提取的二百三十三条原始木工条款要求,来源于七十二份法国公共建筑项目的CCTP文档,涵盖一万九千七百二十五句、六十五万一千九百四十八个词。数据集通过Doccano工具完成命名实体识别(NER)和关系抽取(RE)标注,适用于建筑领域需求工程的自然语言处理研究。 文件详解...
    packageimg
  • 西班牙语循证医学临床试验语料库3版

    2025年12月12日 30 68 0

    数据集概述 该数据集是西班牙语的循证医学临床试验语料库(3版),包含一千二百篇文本(二十九万二千一百七十三条词元),涵盖期刊摘要与临床试验公告,标注了医学实体、语义关系等信息,为医学文本分析提供支持。 文件详解 文件名称:CT-EBM-SP-v3.zip 文件格式:ZIP压缩包...
    packageimg
  • 火星目标百科全书_月球与行星科学会议标注摘要数据集2015_2016

    2025年12月11日 30 77 34

    数据集概述 本数据集包含2015年和2016年月球与行星科学会议(LPSC)发表的117篇摘要的标注文本数据,通过Apache Tika工具提取PDF文本,并以brat标注工具格式提供实体与关系注释,支持文本挖掘与信息提取研究。 文件详解 压缩文件:lpsc-annotated.zip(ZIP格式),包含以下目录和文件:...
    packageimg
  • TBGA基因疾病关联生物医学关系抽取数据集

    2025年12月7日 30 97 8

    数据集概述 该数据集为TBGA,是用于基因-疾病关联(GDA)抽取的大规模半自动标注数据集,包含训练、验证、测试集文本文件及关系名称与ID映射的JSON文件,每条记录对应从句子中提取的单个GDA,以JSON对象结构存储相关信息。 文件详解 数据集压缩包: TBGA.zip,ZIP格式,包含TBGA文件夹及内部所有文件 训练集文本文件:...
    packageimg
  • PMC_Based_SoftwareKG_PMC_软件知识图谱完整数据

    2025年12月6日 30 165 91

    数据集概述 本数据集是从PMC开放获取数据集中提取的软件提及知识图谱(SoftwareKG-PMC),以CSV格式压缩包存储。因PDF格式文章未被纳入,涉及的文章总数为三百零三万六千九百一十三篇,为软件相关学术提及的关联分析提供结构化数据支持。 文件详解 文件名称: csv_files.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 企业实体匹配训练数据集

    2025年11月12日 30 153 1

    企业实体匹配训练数据集_Business_Entity_Matching_Training_Dataset 数据来源:互联网公开数据 标签:实体匹配, 数据融合, 相似度计算, 机器学习, 数据清洗, 关系抽取, 结构化数据, 知识图谱 数据概述: 该数据集包含多个CSV文件(train_data1.csv, train_data2.csv,...
    packageimg
  • 文本信息实体识别与匹配评估数据集

    2025年11月1日 30 28 10

    文本信息实体识别与匹配评估数据集_Text_Information_Entity_Recognition_and_Matching_Evaluation_Dataset 数据来源:互联网公开数据 标签:实体识别, 文本匹配, 自然语言处理, 机器学习, 评估数据集, 命名实体识别, 关系抽取, 文本标注 数据概述:...
    packageimg
  • 疾病医学知识实体关系数据集

    2025年10月17日 30 149 34

    疾病医学知识实体关系数据集_Disease_Medical_Knowledge_Entity_Relationship 数据来源:互联网公开数据 标签:医学知识, 疾病诊断, 实体识别, 关系抽取, 数据挖掘, 生物医学, 机器学习, 知识图谱 数据概述:...
    packageimg
  • 医学文本信息抽取验证数据集

    2025年10月10日 30 7 4

    医学文本信息抽取验证数据集_Medical_Text_Information_Extraction_Validation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 文本标注, 机器学习, 自然语言处理, 医疗健康 数据概述:...
    packageimg
  • 文本信息实体识别与关系抽取评估数据集

    2025年8月25日 60 69 54

    文本信息实体识别与关系抽取评估数据集_Text_Information_Entity_Recognition_and_Relation_Extraction_Evaluation 数据来源:互联网公开数据 标签:实体识别, 关系抽取, 自然语言处理, 文本标注, 深度学习, 模型评估, 机器学习, 文本分析 数据概述:...
    packageimg