找到480个数据集

标签: 信息抽取

过滤结果
  • SNIK_医院信息管理本体论数据24_03

    2026年2月2日 30 106 98

    数据集概述 本数据集为SNIK医院信息管理本体论,包含元模型和多个子本体论,聚焦医疗领域信息管理。数据集以单一压缩包形式提供,未包含训练/测试或原始/处理数据划分,文件类型为压缩文件,无自述文件或内容预览。 文件详解 压缩文件 文件名称:snikproject/ontology-24.03.zip 文件格式:ZIP...
    packageimg
  • KorLeg_韩国多法律领域判决综合分析数据集

    2026年2月1日 30 171 125

    数据集概述 本数据集包含韩国多法律领域的判决数据,由韩国政府立法部公开,旨在支持跨法律领域的综合分析。数据以单一Excel文件形式呈现,无训练测试、数据标签或原始处理数据的拆分,便于研究者直接获取完整法律判决信息。 文件详解 文件名称:KorLeg.xlsx 文件格式:XLSX...
    packageimg
  • tyr_et_sidone_第二天活动XML数据

    2026年2月1日 30 11 4

    数据集概述 本数据集包含与“tyr et sidone seconde journée”相关的单一XML文件,记录了第二天活动的相关信息,无额外目录或文件拆分,数据类型统一为XML格式,可用于获取该主题下的结构化数据内容。 文件详解 文件名称:EMOTHE0722_TyrEtSidonSecondeJournee.xml 文件格式:XML...
    packageimg
  • SXS_BBH_2402双黑洞系统演化模拟数据集

    2026年2月1日 30 176 172

    数据集概述 本数据集是由SpEC代码演化的双黑洞双星系统模拟数据,编号为SXS:BBH:2402。包含36个文件,涵盖元数据、应变波形、额外波形及视界数据等内容,用于记录双黑洞系统演化过程中的物理信息,支持天体物理领域相关研究。 文件详解 科学文件(.h5格式,共18个)...
    packageimg
  • HTI_Based_草药靶点相互作用关系抽取数据集

    2026年1月31日 30 129 72

    数据集概述 本数据集为草药靶点相互作用(HTI)关系抽取数据集,包含中文与英文两种语言的草药靶点相关数据及摘要文件,涉及草药治疗疾病的临床应用、靶点蛋白关联等信息,可用于草药与靶点相互作用的关系挖掘研究,总计包含4个文件。 文件详解 HTI_abstracts_cn.json 文件格式:JSON...
    packageimg
  • 黑客马拉松_TF_TG_关系_注释_黄金标准语料库

    2026年1月31日 30 142 29

    数据集概述 本数据集为TF-TG关系标注黄金标准语料库,包含130个PMID对应的生物医学文献标注数据,以ZIP压缩包形式存储。数据用于基因调控领域的文本标注研究,提供原始摘要文本与BRAT格式的术语及关系标注文件,支持生物医学文本挖掘相关分析。 文件详解 压缩包文件 文件名称:TFTG_V3.zip 文件格式:ZIP...
    packageimg
  • SBL_2020_撒母耳记下拉丁旁注文本案例完整数据

    2026年1月31日 30 46 37

    数据集概述 本数据集是为2020年SBL会议论文《撒母耳记下的拉丁旁注(LaM)文本案例》收集的结构化数据,包含撒母耳记下卷中所有拉丁旁注文本案例的整理结果,为圣经文本批评与拉丁旁注研究提供标准化参考资料。数据集仅包含一个文件。 文件详解 文件名称:Marginal_Latin_cases_1.0.xlsx 文件格式:XLSX 字段映射介绍:作为SBL...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日 30 101 89

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg
  • IN22_BaCo2_AsO4_2_INS原始实验数据

    2026年1月31日 30 61 33

    数据集概述 本数据集包含IN22项目下BaCo2(AsO4)2的INS(非弹性中子散射)原始实验数据,由两个压缩文件组成,未包含处理后的数据或说明文档,主要用于材料科学领域的相关实验分析。 文件详解 文件名称:dispersion.zip 文件格式:ZIP 字段映射介绍:压缩包,具体内容未提供预览,推测包含与色散相关的INS实验数据。...
    packageimg
  • SciExpeM_Based_燃烧实验数据集2022_Combustion_And_Flame

    2026年1月12日 90 28 3

    数据集概述 本数据集来自论文《Combustion And Flame》2022年发表的研究,由SciExpeM平台关联存储,编号为10.5281/zenodo.7904211。数据集包含1个XML格式文件,无训练测试、数据标签或原始处理数据的拆分,主要用于记录燃烧实验相关的元数据信息。 文件详解...
    packageimg
  • VACES_Based大气细颗粒物黑碳棕碳精准观测数据

    2026年1月31日 30 61 44

    数据集概述 本数据集为论文所用的处理后数据,通过多功能气溶胶浓度富集系统(VACES)实现对大气细颗粒物中黑碳和棕碳的精准观测。包含光学数据、性能测试及碳分析相关文件,共四个文件,可用于大气碳组分的特征分析与来源研究。 文件详解 文件名称:Optical data-Total.csv 文件格式:CSV 字段映射介绍:包含日期时间(Date...
    packageimg
  • BDRC_AffilNet_民国人物机构隶属关系网络数据

    2026年1月30日 30 13 5

    数据集概述 本数据集包含构建《民国人物传记词典》(BDRC)中机构隶属关系网络的边列表和节点列表,记录民国人物在机构中的职位关联信息,共2个文件,用于还原历史人物与机构的关联网络。 文件详解 文件名称:BDRC_AffilNet_edgelist.xlsx 文件格式:XLSX...
    packageimg
  • WOLD_Based_古爱尔兰借词数据库_6_9世纪AD

    2026年1月30日 30 106 4

    数据集概述 本数据集为基于古爱尔兰文本构建的借词数据库,文本涵盖公元6-7世纪至9世纪的古爱尔兰文献,参考世界借词数据库(WOLD)的1456个通用词含义(分24类),收录借词、非借词及未证实词汇,共包含2个文件。 文件详解 文件名称:Jasmim Drigo_Old Irish loans.csv 文件格式:CSV...
    packageimg
  • InstructIE_Based_双语指令信息抽取数据集

    2026年1月30日 30 11 2

    数据集概述 本数据集为InstructIE双语指令信息抽取数据集,包含中文和英文两种语言的指令调优数据,覆盖事件、自然科学、建筑结构等多个类别。数据集由9个文件组成,主要文件格式为JSON和MD,适用于信息抽取任务的模型训练与评估。 文件详解 说明文档 文件名称:README_ZH.md、README.md 文件格式:MD...
    packageimg
  • Colección_de_datos_数据集合_文档数据

    2026年1月30日 30 55 11

    数据集概述 本数据集为单一文件的数据集合,包含一份名为UNIDAD 2 FICHAJE的文档文件,无其他子目录或文件分类,未提供训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:UNIDAD 2 FICHAJE.docx 文件格式:DOCX 字段映射介绍:未提供文件内容预览或字段信息 适用场景 文档内容分析:...
    packageimg
  • JR_Pruebadeposito_作者与出版物信息数据

    2026年1月30日 30 107 56

    数据集概述 本数据集包含一份关于作者与出版物信息的文档,核心内容为作者及其相关出版物的关联信息,以单一Excel文件形式呈现,可用于学术文献相关的信息整理与分析。 文件详解 文件名称:JR-Pruebadeposito-Iniciales.xlsx 文件格式:XLSX...
    packageimg
  • La_Pola_Siero_西班牙地图_问题4_语料数据

    2026年1月30日 30 50 29

    数据集概述 本数据集包含与“西班牙地图:问题4”相关的语料数据,源自La Pola Siero地区的语言材料,以单一文档形式呈现,未进行训练/测试、数据/标签或原始/处理等类型的划分。 文件详解 文件名称:Mapa de España.Pregunta4.docx 文件格式:DOCX...
    packageimg
  • SciExpeM_Based_能源研究XML元数据_数据集

    2026年1月30日 30 34 26

    数据集概述 本数据集来自SciExpeM平台,关联文献为Hu、Yu于2018年发表在Energy期刊的研究(卷147,页码876-883)。包含1个XML格式的元数据文件,无目录分层或数据拆分,用于记录能源研究相关的结构化信息。 文件详解 文件名称:10.5281/zenodo.6653370.xml 文件格式:XML...
    packageimg
  • Wikidata_RDF_Based_政治家数据转储文件集

    2026年1月30日 30 9 7

    数据集概述 本数据集是通过wdumps工具生成的Wikidata政治家相关RDF转储数据,包含实体、陈述及三元组等信息,共4个文件,覆盖.json、.gz、.nt三种格式,可用于语义网络分析、政治家信息提取等场景。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Test_dataset_Based_测试实验数据_压缩包

    2026年1月30日 30 88 7

    数据集概述 本数据集为Test实验相关的测试数据集,包含1个压缩包文件,无目录结构,未检测到文件命名模式、训练/测试划分、数据/标签划分及原始/处理数据划分,无README或内容预览,核心关键词为“experiment: test”。 文件详解 压缩包文件 文件名称:test-db.zip 文件格式:.zip...
    packageimg