找到494个数据集

标签: 信息抽取

过滤结果
  • 黑客马拉松_TF_TG_关系_注释_黄金标准语料库

    2026年1月31日   

    数据集概述 本数据集为TF-TG关系标注黄金标准语料库,包含130个PMID对应的生物医学文献标注数据,以ZIP压缩包形式存储。数据用于基因调控领域的文本标注研究,提供原始摘要文本与BRAT格式的术语及关系标注文件,支持生物医学文本挖掘相关分析。 文件详解 压缩包文件 文件名称:TFTG_V3.zip 文件格式:ZIP...
    packageimg
  • SBL_2020_撒母耳记下拉丁旁注文本案例完整数据

    2026年1月31日   

    数据集概述 本数据集是为2020年SBL会议论文《撒母耳记下的拉丁旁注(LaM)文本案例》收集的结构化数据,包含撒母耳记下卷中所有拉丁旁注文本案例的整理结果,为圣经文本批评与拉丁旁注研究提供标准化参考资料。数据集仅包含一个文件。 文件详解 文件名称:Marginal_Latin_cases_1.0.xlsx 文件格式:XLSX 字段映射介绍:作为SBL...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日   

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg
  • IN22_BaCo2_AsO4_2_INS原始实验数据

    2026年1月31日   

    数据集概述 本数据集包含IN22项目下BaCo2(AsO4)2的INS(非弹性中子散射)原始实验数据,由两个压缩文件组成,未包含处理后的数据或说明文档,主要用于材料科学领域的相关实验分析。 文件详解 文件名称:dispersion.zip 文件格式:ZIP 字段映射介绍:压缩包,具体内容未提供预览,推测包含与色散相关的INS实验数据。...
    packageimg
  • SciExpeM_Based_燃烧实验数据集2022_Combustion_And_Flame

    2026年1月12日   

    数据集概述 本数据集来自论文《Combustion And Flame》2022年发表的研究,由SciExpeM平台关联存储,编号为10.5281/zenodo.7904211。数据集包含1个XML格式文件,无训练测试、数据标签或原始处理数据的拆分,主要用于记录燃烧实验相关的元数据信息。 文件详解...
    packageimg
  • VACES_Based大气细颗粒物黑碳棕碳精准观测数据

    2026年1月31日   

    数据集概述 本数据集为论文所用的处理后数据,通过多功能气溶胶浓度富集系统(VACES)实现对大气细颗粒物中黑碳和棕碳的精准观测。包含光学数据、性能测试及碳分析相关文件,共四个文件,可用于大气碳组分的特征分析与来源研究。 文件详解 文件名称:Optical data-Total.csv 文件格式:CSV 字段映射介绍:包含日期时间(Date...
    packageimg
  • BDRC_AffilNet_民国人物机构隶属关系网络数据

    2026年1月30日   

    数据集概述 本数据集包含构建《民国人物传记词典》(BDRC)中机构隶属关系网络的边列表和节点列表,记录民国人物在机构中的职位关联信息,共2个文件,用于还原历史人物与机构的关联网络。 文件详解 文件名称:BDRC_AffilNet_edgelist.xlsx 文件格式:XLSX...
    packageimg
  • WOLD_Based_古爱尔兰借词数据库_6_9世纪AD

    2026年1月30日   

    数据集概述 本数据集为基于古爱尔兰文本构建的借词数据库,文本涵盖公元6-7世纪至9世纪的古爱尔兰文献,参考世界借词数据库(WOLD)的1456个通用词含义(分24类),收录借词、非借词及未证实词汇,共包含2个文件。 文件详解 文件名称:Jasmim Drigo_Old Irish loans.csv 文件格式:CSV...
    packageimg
  • InstructIE_Based_双语指令信息抽取数据集

    2026年1月30日   

    数据集概述 本数据集为InstructIE双语指令信息抽取数据集,包含中文和英文两种语言的指令调优数据,覆盖事件、自然科学、建筑结构等多个类别。数据集由9个文件组成,主要文件格式为JSON和MD,适用于信息抽取任务的模型训练与评估。 文件详解 说明文档 文件名称:README_ZH.md、README.md 文件格式:MD...
    packageimg
  • Colección_de_datos_数据集合_文档数据

    2026年1月30日   

    数据集概述 本数据集为单一文件的数据集合,包含一份名为UNIDAD 2 FICHAJE的文档文件,无其他子目录或文件分类,未提供训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:UNIDAD 2 FICHAJE.docx 文件格式:DOCX 字段映射介绍:未提供文件内容预览或字段信息 适用场景 文档内容分析:...
    packageimg
  • JR_Pruebadeposito_作者与出版物信息数据

    2026年1月30日   

    数据集概述 本数据集包含一份关于作者与出版物信息的文档,核心内容为作者及其相关出版物的关联信息,以单一Excel文件形式呈现,可用于学术文献相关的信息整理与分析。 文件详解 文件名称:JR-Pruebadeposito-Iniciales.xlsx 文件格式:XLSX...
    packageimg
  • La_Pola_Siero_西班牙地图_问题4_语料数据

    2026年1月30日   

    数据集概述 本数据集包含与“西班牙地图:问题4”相关的语料数据,源自La Pola Siero地区的语言材料,以单一文档形式呈现,未进行训练/测试、数据/标签或原始/处理等类型的划分。 文件详解 文件名称:Mapa de España.Pregunta4.docx 文件格式:DOCX...
    packageimg
  • SciExpeM_Based_能源研究XML元数据_数据集

    2026年1月30日   

    数据集概述 本数据集来自SciExpeM平台,关联文献为Hu、Yu于2018年发表在Energy期刊的研究(卷147,页码876-883)。包含1个XML格式的元数据文件,无目录分层或数据拆分,用于记录能源研究相关的结构化信息。 文件详解 文件名称:10.5281/zenodo.6653370.xml 文件格式:XML...
    packageimg
  • Wikidata_RDF_Based_政治家数据转储文件集

    2026年1月30日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata政治家相关RDF转储数据,包含实体、陈述及三元组等信息,共4个文件,覆盖.json、.gz、.nt三种格式,可用于语义网络分析、政治家信息提取等场景。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Test_dataset_Based_测试实验数据_压缩包

    2026年1月30日   

    数据集概述 本数据集为Test实验相关的测试数据集,包含1个压缩包文件,无目录结构,未检测到文件命名模式、训练/测试划分、数据/标签划分及原始/处理数据划分,无README或内容预览,核心关键词为“experiment: test”。 文件详解 压缩包文件 文件名称:test-db.zip 文件格式:.zip...
    packageimg
  • SXS_BBH_1443_Based双黑洞系统模拟原始数据

    2026年1月29日   

    数据集概述 本数据集为SXS:BBH:1443双黑洞系统模拟数据,由SpEC代码演化生成,包含36个文件,涵盖JSON和H5两种格式,无目录结构。数据涉及多等级(Lev1-Lev3)的元数据、应变波形及额外波形文件,用于记录双黑洞系统模拟的关键参数与结果。 文件详解 元数据文件...
    packageimg
  • Corpus_of_protocols_实验协议语料库数据集

    2026年1月29日   

    数据集概述 本数据集为用于学术分析的实验协议语料库,包含经分析的实验协议相关数据,旨在为学术研究提供结构化的协议文本资源。数据集仅含一个文件,无目录层级划分,未区分训练/测试、数据/标签或原始/处理数据,专注于提供完整的实验协议语料内容。 文件详解 文件名称:corpus of protocols.xlsx 文件格式:XLSX...
    packageimg
  • Evaluation_Prompt_基于评估与提示的文档数据

    2026年1月29日   

    数据集概述 本数据集包含一份与“Evaluation and Prompt”相关的文档,未涉及训练测试、数据标签或原始处理等数据拆分,整体结构简单,仅包含一个文档文件。 文件详解 文件名称:eval CFG.docx 文件格式:DOCX 字段映射介绍:未提供具体字段信息,文件内容与“Evaluation and...
    packageimg
  • EconBiz_Based_经济学学术图表文本提取图像数据集

    2026年1月29日   

    数据集概述 本数据集是经济学领域的学术图表文本提取语料库,包含121张学术图表,随机抽取自EconBiz的288,000篇开放获取出版物。图表类型涵盖条形图、饼图、折线图、地图、散点图等,所有图表均经过人工标注形成黄金标准,用于评估文本提取工具。 文件详解 文件名称:EconBiz.zip 文件格式:ZIP...
    packageimg
  • Tianjin_Based华北地区冬季大气气溶胶多组分数据集

    2026年1月29日   

    数据集概述 本数据集记录了中国北方天津地区冬季大气中9级粒径分级气溶胶的组分分析结果,包含无机离子、碳质组分、二元酸及相关化合物的浓度数据,可用于研究该区域冬季大气气溶胶的来源及二次转化过程。 文件详解 文件名称:Data set_SRD et al..xlsx 文件格式:XLSX...
    packageimg