找到491个数据集

标签: 信息抽取

过滤结果
  • 文档补充_材料数据

    2026年2月15日 30 164 80

    数据集概述 本数据集包含一份补充材料文档,文件类型为docx格式,无额外目录或文件拆分,未区分训练/测试、数据/标签及原始/处理数据,整体为单一文档结构。 文件详解 文件名称:Supplementary materials.docx 文件格式:docx 字段映射介绍:无公开内容预览,具体字段需基于文档实际内容确定 适用场景...
    packageimg
  • 波兰数学家合作论文贡献度百分比数据

    2026年2月15日 30 11 5

    数据集概述 本数据集包含波兰数学领域 habilitacja 学位申请者的作者信息、出版物及合著者贡献百分比数据,用于研究合著者姓名排序与相对贡献。数据从公共平台及大学网站提取,涵盖申请年份、贡献占比等关键字段,以单份Excel文件呈现。 文件详解...
    packageimg
  • Tables_文章表格数据

    2026年2月12日 30 205 115

    数据集概述 本数据集包含某篇文章的全部表格内容,以单一文档文件形式呈现,未进行训练测试、数据标签或原始处理等拆分,主要用于提供文章表格的结构化参考。 文件详解 文件名称:table.docx 文件格式:DOCX 字段映射介绍:包含文章中的所有表格内容,具体字段需根据表格实际内容确定,无预览信息提供详细字段说明。 适用场景...
    packageimg
  • 食品基质分析样本材料名称数据

    2026年2月12日 30 102 20

    数据集概述 本数据集记录食品基质分析样本的构成材料名称,包含1个文件,为食品检测领域中样本成分分析提供基础材料信息参考。 文件详解 文件名称:MTX_14.3_LEMMI_MIC.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段预览,推测包含食品基质分析样本对应的构成材料名称相关信息。 适用场景...
    packageimg
  • Chapter5_Based_文档数据

    2026年2月9日 30 195 80

    数据集概述 本数据集包含一份编号为Chapter 5的文档数据,无额外描述信息。数据集结构简单,仅含单个文件,未划分训练/测试集、数据/标签集或原始/处理数据集,主要用于文档内容的直接查阅或基础处理。 文件详解 文件名称:Chapter 5.docx 文件格式:DOCX 字段映射介绍:无公开预览或内容说明,文件具体内容需打开后查看 适用场景...
    packageimg
  • SXS_BBH_2402双黑洞系统演化模拟数据集

    2026年2月1日 60 143 32

    数据集概述 本数据集是由SpEC代码演化的双黑洞双星系统模拟数据,编号为SXS:BBH:2402。包含36个文件,涵盖元数据、应变波形、额外波形及视界数据等内容,用于记录双黑洞系统演化过程中的物理信息,支持天体物理领域相关研究。 文件详解 科学文件(.h5格式,共18个)...
    packageimg
  • IN01026_Devagiri_Grant梵语XML铭文数据

    2026年2月9日 30 92 75

    数据集概述 本数据集包含IN01026号梵语铭文《Devagiri Grant of Devavarman》的XML文件,无元数据。数据核心为该梵语铭文的数字化文本内容,共1个文件,用于梵语铭文文献的数字化保存与研究。 文件详解 文件名称:IN01026.xml 文件格式:XML 字段映射介绍:包含Devavarman的Devagiri...
    packageimg
  • Hermano_Q1613449_自然历史标本采集鉴定记录数据

    2026年1月28日 30 183 74

    数据集概述 本数据集包含由Hermano Nicéforo María采集、鉴定并存放的自然历史标本数据,数据基于全球生物多样性信息设施(GBIF)的标本记录,在Bionomia平台进行声明或归属标注,共包含2个文件。 文件详解 Q1613449.csv 文件格式:CSV...
    packageimg
  • test_pressure_field_实验测试压力场文档数据

    2026年2月9日 30 74 27

    数据集概述 本数据集为test压力场相关的实验测试数据,包含一份文档文件,未进行训练/测试、数据/标签、原始/处理等数据划分,文件类型单一,无额外说明文档或内容预览。 文件详解 文件名称:Test.docx 文件格式:DOCX 字段映射介绍:无可用字段映射信息,无README或内容预览。 适用场景...
    packageimg
  • PEQQS_Based_科学文献数量型问答检索全流程评估数据集

    2026年2月9日 30 204 92

    数据集概述 本数据集聚焦科学文献中的数量型抽取式问答场景,包含1031篇农业科学摘要的数量答案标注,以及基于39个查询的1130条查询-文档相关性判断。数据集支持信息检索与问答模块的端到端评估,可用于研究检索质量对下游问答结果的影响,尤其是大语言模型处理无关文档时的幻觉问题。 文件详解 quantities_ground_truth.json...
    packageimg
  • WWW2020_Based_Web表格新实体发现实验复现资源

    2026年2月8日 30 139 115

    数据集概述 本数据集是论文《Novel Entity Discovery from Web Tables》的实验复现资源,包含三个用于Web表格新实体发现、实体类型与提及解析的测试集,以及300万张表格的提及-实体、标题-属性对应关系数据,支持论文中实体链接、表格匹配、实体解析实验的复现。 文件详解 压缩包文件...
    packageimg
  • GraphQL_SMS_Based系统映射研究补充材料数据集

    2026年2月8日 30 64 13

    数据集概述 本数据集是论文“GraphQL: A Systematic Mapping Study”的补充材料,包含系统映射研究过程中产生的三类核心文件,分别对应研究识别、初步研究数据集及数据提取结果,为GraphQL相关学术研究提供结构化的辅助数据支持。 文件详解 01 SMS-Study-Identification.xlsx 文件格式:XLSX...
    packageimg
  • heureCLÉA_Source_项目源文档数据1_0

    2026年2月7日 30 131 98

    数据集概述 本数据集为heureCLÉA项目的源文档数据,版本为1.0。数据以压缩包形式存储,包含项目相关的源文档内容,未区分训练/测试、数据/标签或原始/处理数据类型,无可用的自述文件或内容预览。 文件详解 文件名称:heureclea/sourcedocuments-1.0.zip 文件格式:ZIP...
    packageimg
  • SNIK_医院信息管理本体论数据24_03

    2026年2月2日 30 60 49

    数据集概述 本数据集为SNIK医院信息管理本体论,包含元模型和多个子本体论,聚焦医疗领域信息管理。数据集以单一压缩包形式提供,未包含训练/测试或原始/处理数据划分,文件类型为压缩文件,无自述文件或内容预览。 文件详解 压缩文件 文件名称:snikproject/ontology-24.03.zip 文件格式:ZIP...
    packageimg
  • KorLeg_韩国多法律领域判决综合分析数据集

    2026年2月1日 30 177 164

    数据集概述 本数据集包含韩国多法律领域的判决数据,由韩国政府立法部公开,旨在支持跨法律领域的综合分析。数据以单一Excel文件形式呈现,无训练测试、数据标签或原始处理数据的拆分,便于研究者直接获取完整法律判决信息。 文件详解 文件名称:KorLeg.xlsx 文件格式:XLSX...
    packageimg
  • tyr_et_sidone_第二天活动XML数据

    2026年2月1日 30 166 1

    数据集概述 本数据集包含与“tyr et sidone seconde journée”相关的单一XML文件,记录了第二天活动的相关信息,无额外目录或文件拆分,数据类型统一为XML格式,可用于获取该主题下的结构化数据内容。 文件详解 文件名称:EMOTHE0722_TyrEtSidonSecondeJournee.xml 文件格式:XML...
    packageimg
  • HTI_Based_草药靶点相互作用关系抽取数据集

    2026年1月31日 30 37 23

    数据集概述 本数据集为草药靶点相互作用(HTI)关系抽取数据集,包含中文与英文两种语言的草药靶点相关数据及摘要文件,涉及草药治疗疾病的临床应用、靶点蛋白关联等信息,可用于草药与靶点相互作用的关系挖掘研究,总计包含4个文件。 文件详解 HTI_abstracts_cn.json 文件格式:JSON...
    packageimg
  • 黑客马拉松_TF_TG_关系_注释_黄金标准语料库

    2026年1月31日 30 65 41

    数据集概述 本数据集为TF-TG关系标注黄金标准语料库,包含130个PMID对应的生物医学文献标注数据,以ZIP压缩包形式存储。数据用于基因调控领域的文本标注研究,提供原始摘要文本与BRAT格式的术语及关系标注文件,支持生物医学文本挖掘相关分析。 文件详解 压缩包文件 文件名称:TFTG_V3.zip 文件格式:ZIP...
    packageimg
  • SBL_2020_撒母耳记下拉丁旁注文本案例完整数据

    2026年1月31日 30 75 17

    数据集概述 本数据集是为2020年SBL会议论文《撒母耳记下的拉丁旁注(LaM)文本案例》收集的结构化数据,包含撒母耳记下卷中所有拉丁旁注文本案例的整理结果,为圣经文本批评与拉丁旁注研究提供标准化参考资料。数据集仅包含一个文件。 文件详解 文件名称:Marginal_Latin_cases_1.0.xlsx 文件格式:XLSX 字段映射介绍:作为SBL...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日 30 9 5

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg