找到494个数据集

标签: 信息抽取

过滤结果
  • 阿马迪西格洛二十世基于_唐吉诃德_死亡情节的骑士文学现代改写数据库数据_v1_2

    2026年1月19日   

    数据集概述 本数据集属于AmadissigloXX数据库(由Elisabetta Sarmati指导),收录骑士文学及《堂吉诃德》的现代改写作品。此次提供Andrés Trapiello于2004年创作的《Al morir don Quijote》相关数据,包含元数据及完整数据库信息,共2个文件。 文件详解 JSON格式文件...
    packageimg
  • Contractual_Events_Based_法院判决合同事件信息提取数据集

    2026年1月19日   

    数据集概述 本数据集聚焦合同相关的法院判决文本,用于信息提取尤其是事件提取任务。内容涵盖合同关系及影响其的事件,如合同谈判、签订、终止等环节,为法律文本的事件分析提供结构化资源,包含一个压缩文件。 文件详解 文件名称:contractual-events-dataset.zip 文件格式:ZIP...
    packageimg
  • bentuk_pemerintahan_indonesia_印尼政府形式讨论文档

    2026年1月19日   

    数据集概述 本数据集包含一份关于印尼政府形式的讨论文档,内容为对印尼政治体制形式的探讨与交流。文档可能存在少量用词错误,整体用于记录印尼政府形式相关的讨论内容,为研究印尼政治体制提供参考资料。 文件详解 文件名称:bentuk pemerintahan indonesia.docx 文件格式:DOCX...
    packageimg
  • Bionomia_Linked_O_UiO_维管植物标本馆采集者与鉴定者关联数据

    2026年1月19日   

    数据集概述 本数据集为奥斯陆大学(UiO)维管植物标本馆(O)的自然历史标本数据,包含与标本采集者和鉴定者的关联信息。数据由Bionomia平台志愿者整理,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,共11个文件。 文件详解 核心数据文件(.zip格式,共10个)...
    packageimg
  • Hofdiarium_1665_Based德累斯顿宫廷日记库兰特手写体基准数据集

    2026年1月19日   

    数据集概述 本数据集为17世纪萨克森库兰特手写体的手写文本识别(HTR/OCR)基准数据集,包含《选帝侯约翰·格奥尔格二世1665年宫廷日记》(SLUB Mscr.Dresd.K.80)的10页(fol.85r-89v)基准数据,采用eScriptorium完成图像与文本对齐,提供多种格式文件及转录指南。 文件详解 压缩包文件...
    packageimg
  • Fukue_Based_2019_2020年福江岛棕碳气溶胶光学与化学性质数据集

    2026年1月19日   

    数据集概述 本数据集记录了2019-2020年日本福江岛棕碳气溶胶的光学与化学性质相关信息,包含一份Excel格式文件,可用于研究棕碳气溶胶的理化特性及环境影响。 文件详解 文件名称:brc_absorption_organics_sources_fukue.xlsx 文件格式:XLSX...
    packageimg
  • musixplora_k3314_Jürgen_Klier个人档案数据_v0_0_1

    2026年1月18日   

    数据集概述 本数据集为musixplora平台上Jürgen Klier(ID:k3314)的个人档案数据,包含其基本信息、职业背景、活动地点、相关文献及更新记录等内容,是研究该人物职业经历与音乐领域贡献的结构化参考资料。 文件详解 文件名称:k3314_DE.json 文件格式:JSON 字段映射介绍:...
    packageimg
  • EVB_Herbário_Evaldo_Buttura_标本馆采集者与鉴定者关联数据

    2026年1月18日   

    数据集概述 本数据集关联了EVB标本馆(Herbário Evaldo Buttura)及虚拟植物标本馆REFLORA中的自然历史标本数据与采集者、鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data包格式组织,包含9个文件。 文件详解 数据文件...
    packageimg
  • BeijingTEs_Source_中国北京城市大气细颗粒物小时级微量元素特征与来源数据

    2026年1月13日   

    数据集概述 本数据集包含中国北京城市大气细颗粒物中小时级微量元素的特征与来源相关数据,是支撑相关研究论文的核心数据文件,可用于分析大气细颗粒物中微量元素的时间分布特征及来源解析。 文件详解 文件名称:Data for BeijingTEs.xlsx 文件格式:XLSX...
    packageimg
  • Deepex_Supplementary_Zero_Shot信息抽取文本转三元组补充数据集

    2026年1月17日   

    数据集概述 本数据集是Zero-Shot信息抽取任务(统一为文本转三元组翻译任务)的补充数据,支持Deepex模型相关研究。包含3个文件,覆盖JSON和CSV格式,无训练/测试、数据/标签等划分,核心内容为信息抽取所需的文本与三元组映射数据。 文件详解 文件名称:wk_q2name.json 文件格式:JSON...
    packageimg
  • Bionomia_联合艺术家项目_42个样本_13个物种_苔藓真菌标本采集者与鉴定者关联数据

    2026年1月17日   

    数据集概述 本数据集为artsprosjektet_42-13_bryofungi项目的自然历史标本数据,关联了标本对应的采集者与鉴定者信息。数据由Bionomia平台志愿者标注生成,基于Global Biodiversity Information Facility聚合的标本数据,以Frictionless Data数据包格式组织,包含9个相关文件。...
    packageimg
  • g2408_Based_Gottlob_Ferdinand_Gruber音乐家个人信息数据集

    2026年1月17日   

    数据集概述 本数据集为音乐家Gottlob Ferdinand Gruber(musiXplora-ID:g2408)的个人信息档案,包含其基本身份信息、生卒年份、活动地点、职业领域及相关文献引用等内容,为音乐学领域研究该音乐家的背景与活动提供结构化数据支持。 文件详解 文件名称:g2408_DE.json 文件格式:JSON...
    packageimg
  • c0777_musiXplora_Raffaele_Calace_音乐家档案数据

    2026年1月15日   

    数据集概述 本数据集是音乐家Raffaele Calace(musiXplora-ID: c0777)的结构化个人档案数据,包含其基本信息、职业身份、活动领域、生平事件及相关资料来源等内容,为音乐历史研究提供标准化的人物信息参考。 文件详解 文件名称:c0777_DE.json 文件格式:JSON...
    packageimg
  • musixplora_Giorgio_Stohas_s4556_音乐人物档案数据

    2026年1月15日   

    数据集概述 本数据集为Giorgio Stohas (s4556)的音乐人物档案数据,包含其基本信息、职业领域、活动地点、相关文献及事件等内容,源自musixplora平台,以JSON格式存储,可用于音乐人物研究与档案查询。 文件详解 文件名称:s4556_DE.json 文件格式:JSON...
    packageimg
  • musiXplora_m2302_Hans_Houb_Muler_音乐家档案数据

    2026年1月15日   

    数据集概述 本数据集为音乐家Hans Houb Muler(musiXplora-ID:m2302)的个人档案数据,包含其基本信息、职业领域、活动地点、相关文献及事件记录等内容,以JSON格式存储,是研究该音乐家生平及相关音乐历史的参考资料。 文件详解 文件名称:m2302_DE.json 文件格式:JSON...
    packageimg
  • musiXplora_Based_Leonhard_Stützer音乐人物档案数据

    2026年1月15日   

    数据集概述 本数据集为音乐人物Leonhard Stützer的个人档案数据,包含其基本信息、职业背景、活动地点及相关文献记录等内容,通过结构化JSON文件呈现,为研究19世纪乐器制造领域人物提供基础资料。 文件详解 文件名称:s4364_DE.json 文件格式:JSON...
    packageimg
  • Eleições_Parlamentares_Brasil_Twitter竞选数据

    2026年1月15日   

    数据集概述 本数据集支持研究“Eleições Parlamentares no Brasil: o Uso do Twitter na Busca por Votos”,聚焦巴西议会选举中Twitter在竞选活动中的应用。数据集包含一个文件,未划分训练/测试集、数据/标签集或原始/处理数据,文件类型单一,为Excel格式。 文件详解...
    packageimg
  • EDI_Subgrantees_RP1Export_第一报告期非隐私受益方数据2019

    2026年1月14日   

    数据集概述 本数据集为第一报告期(M15,即2019年3月)结束时EDI_SubGrantees_DB的导出数据,包含三个公开征集的受益方信息及所获资金数据,仅导出非隐私敏感字段,旨在提升透明度与受益方的可发现性。 文件详解 文件名称:D1.3_Beneficiaries dataset.xlsx 文件格式:XLSX...
    packageimg
  • b3529_musiXplora_Luigi_Berlingozzi_音乐人物档案数据

    2026年1月14日   

    数据集概述 本数据集为音乐人物Luigi Berlingozzi(musiXplora-ID:b3529)的结构化档案数据,包含其基本信息、职业、活动地点、相关文献及事件记录,存储为单一JSON文件,是研究古典音乐乐器制作领域人物的参考资料。 文件详解 文件名称:b3529_DE.json 文件格式:JSON...
    packageimg
  • musiXplora_Source_Albert_David_d1202_人物档案数据

    2026年1月14日   

    数据集概述 本数据集为musiXplora平台收录的人物档案数据,核心内容是关于Albert David(musiXplora-ID:d1202)的个人信息,包括其基本身份信息、生平时间节点、职业领域、活动地点、家庭关系及相关文献来源等结构化内容,为音乐历史研究提供人物参考资料。 文件详解 文件名称:d1202_DE.json 文件格式:JSON...
    packageimg