找到494个数据集

标签: 信息抽取

过滤结果
  • musiXplora_e1199_Michael_Engler传记信息数据

    2026年1月21日   

    数据集概述 本数据集为音乐家Michael Engler(musiXplora-ID:e1199)的传记档案数据,包含其基本身份信息、生卒时间与地点、职业领域、活动地点、文献提及记录及相关来源等内容,以结构化JSON格式存储,是研究该音乐家生平与职业活动的基础资料。 文件详解 e1199_DE.json 文件格式:JSON...
    packageimg
  • LingualEchol_Based舌击蝙蝠回声定位参数提取数据集2021

    2026年1月21日   

    数据集概述 本数据集为论文“Hearing, echolocation, and beam steering from Day 0 in tongue-clicking bats”配套的参数提取数据及分析脚本,包含一份清理后的Excel数据集和一个MATLAB分析脚本,用于提取舌击蝙蝠的回声定位参数,支持研究蝙蝠出生初期的听觉、回声定位及波束控制能力。...
    packageimg
  • Bionomia_Based_Massalongo采集鉴定自然历史标本数据

    2026年1月21日   

    数据集概述 本数据集包含由Abramo Bartolommeo Massalongo采集、鉴定或存放的自然历史标本数据,数据来源于Global Biodiversity Information Facility(GBIF),并在Bionomia平台上进行声明或归属标注。数据集提供结构化的标本记录,支持生物多样性研究与标本信息追溯。 文件详解...
    packageimg
  • Bionomia_Based_Dermaptera标本采集者与鉴定者关联数据

    2026年1月20日   

    数据集概述 本数据集包含Dermaptera(革翅目)自然历史标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据构建,采用Frictionless Data数据包格式,共包含九份文件,用于生物标本数据的关联分析与溯源。 文件详解 压缩文件包(共8个)...
    packageimg
  • SciExpeM_Based_zenodo_5137105文献数据_2013

    2026年1月20日   

    数据集概述 本数据集包含与论文“Journal Of Engineering For Gas Turbines And Power, 2013,...
    packageimg
  • Interruption_Based_手动标注会议打断音频转录数据集2024

    2026年1月20日   

    数据集概述 本数据集改编自加拿大菲沙河谷大学创建的Group Affect and Performance数据集,包含手动标注的重叠话语(分为真实打断和非真实打断)音频文件、结构化标注数据及原始完整会议音频与转录文本。数据源于14组会议,从355个重叠话语实例中筛选出200个真实打断,支持对话打断行为的分析研究。 文件详解...
    packageimg
  • Bionomia_Based_安大略省沼泽天南星首次记录采集者鉴定者关联数据

    2026年1月20日   

    数据集概述 本数据集为安大略省沼泽天南星(Arisaema stewardsonii)首次记录相关的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注生成,基于GBIF聚合的标本数据集,采用Frictionless Data数据包格式组织,包含11个文件。 文件详解 数据包描述文件...
    packageimg
  • CMIF_Based_柏林自由大学纪伯伦情书数字化文献数据集_2023_24

    2026年1月20日   

    数据集概述 本数据集是基于《纪伯伦情书》(1995年牛津One World出版)的数字化文献资源,由柏林自由大学Eins@FU学习工坊的学生在2023/24学期通过CMIF Creator工具创建,包含纪伯伦的情书内容及编辑信息,共2个文件。 文件详解 文件名称:README.md 文件格式:MD...
    packageimg
  • LLCT1_Based_晚期拉丁语宪章树库1_LLCT1_1_2版本标注数据

    2026年1月20日   

    数据集概述 本数据集为晚期拉丁语宪章树库1(LLCT1)的1.2版本,包含对公元714-869年意大利早期中世纪拉丁语文献的形态和句法标注,标注格式兼容拉丁语依存树库(LDT),采用布拉格风格树库格式(PML)。数据集总计包含一个文件,是研究中世纪拉丁语语言特征的重要资源。 文件详解 文件名称:LLCT1, version 1.2.xml...
    packageimg
  • f1440_Based_Hans_Conrad_Fischer_人物档案数据

    2026年1月20日   

    数据集概述 本数据集为musiXplora平台收录的Hans Conrad Fischer(ID:f1440)人物档案数据,包含其基本信息、职业经历、活动地点、关联机构等内容,以结构化JSON文件呈现,是研究该人物职业轨迹与行业贡献的基础资料。 文件详解 文件名称:f1440_DE.json 文件格式:JSON...
    packageimg
  • Dialogicity_Based_加泰罗尼亚高中生文化素养对话编码转录数据

    2026年1月20日   

    数据集概述 本数据集包含加泰罗尼亚两所公立高中四年级学生的对话转录与编码数据,基于文化素养主题的对话教学干预生成。数据覆盖面对面与在线两种对话场景,采用对话性编码体系(测量知识共建程度与同伴参与度),共15个文件,包含对话内容、编码标签等信息。 文件详解 对话编码文件...
    packageimg
  • Espacenet_Based_西班牙2004_2014纳米技术专利检索数据

    2026年1月20日   

    数据集概述 本数据集包含2004-2014年西班牙在纳米技术领域的3278项专利数据,基于Espacenet平台的检索条件筛选生成,检索逻辑结合了时间范围、地域、国际分类号及关键词等维度,可用于纳米技术领域专利分析与研究。 文件详解 文件名称:nano_ALL_2004_2014_norm.xlsx 文件格式:XLSX...
    packageimg
  • Tianjin_Based_PM2_5水溶性有机物稳定碳同位素全年观测数据集

    2026年1月20日   

    数据集概述 本数据集记录2018年7月5日至2019年7月4日天津市区(南开区)和郊区(海河教育园)PM2.5中二酸、含氧酸、α-二羰基化合物、柠檬酸及脂肪酸的稳定碳同位素(δ13C)全年观测数据,通过气相色谱-同位素比值质谱联用系统测定,用于分析污染物来源及光化学过程,含1个文件。 文件详解 文件名称:Li et al. δ13C of...
    packageimg
  • musiXplora_Source_Bela_Szepessy音乐家传记数据

    2026年1月20日   

    数据集概述 本数据集为音乐家Bela Szepessy(musiXplora-ID:s5487)的传记信息,包含其基本信息、职业、活动地点、教育背景、工作经历及相关文献等内容,数据来源于musiXplora平台,以JSON格式存储。 文件详解 文件名称:s5487_DE.json 文件格式:JSON...
    packageimg
  • HEFCE_Adviser_Ben_Johnson高等教育政策访谈记录2019

    2026年1月20日   

    数据集概述 本数据集为英国高等教育资助委员会(HEFCE)高等教育政策顾问Ben Johnson的访谈记录。数据经伦理同意收集,作为伦敦国王学院人文学科开放获取出版博士研究的一部分,访谈者已授权将记录以CC0协议公开,于2019年作者博士毕业时发布。 文件详解 文件名称:Ben Johnson_transcript.docx 文件格式:DOCX...
    packageimg
  • Pracalit_OCR_Based梵语与纽瓦手稿OCR模型真值数据_持续更新

    2026年1月20日   

    数据集概述 本数据集为Pracalit字体梵语与纽瓦手稿OCR模型的真值数据,包含PNG和XML文件,将持续更新。基于四份尼泊尔手稿的Pracalit Unicode转录文本创建,用于训练Transkribus平台的PyLaia模型,涵盖16至19世纪的梵语与纽瓦语手稿,支持古文字OCR模型的开发与优化。 文件详解...
    packageimg
  • Bionomia_Based_Nigel_Pitman自然历史标本收集鉴定数据

    2026年1月19日   

    数据集概述 本数据集记录Nigel Pitman收集、鉴定的自然历史标本数据,数据源自Global Biodiversity Information Facility,通过Bionomia平台进行声明或归属标注。包含JSON和CSV两种格式文件,总计2个文件,无目录层级划分,无训练测试、数据标签或原始处理数据的拆分。 文件详解...
    packageimg
  • SciExpeM_Based_zenodo_5137131_工程数据_2013

    2026年1月19日   

    数据集概述 本数据集为SciExpeM项目相关的工程数据,来自Zenodo平台编号10.5281/zenodo.5137131的资源,关联2013年《Journal Of Engineering For Gas Turbines And Power》期刊文献,包含1个XML格式文件,无训练测试、数据标签或原始处理数据拆分。 文件详解...
    packageimg
  • Shanghai_BC_Based上海黑碳浓度时空特征与来源分析数据集2017

    2026年1月19日   

    数据集概述 本数据集关联研究论文《Temporal characteristics and potential sources of black carbon in megacity Shanghai,...
    packageimg
  • 保护现状_抵御_绿色病毒_荷兰人民党_PVV_与自由党_VB_政治主张文档汇编

    2026年1月19日   

    数据集概述 本数据集包含荷兰政治语境下的文档集合,核心围绕“保护现状对抗绿色病毒”主题,涉及PVV和Vlaams Belang(VB)政党相关的93份文档,涵盖能源政策、政治主张等内容,文件类型统一为DOCX格式,无目录层级结构。 文件详解 文档文件 文件名称:遵循PVV_XX.docx、VB_XX.docx或含日期/标题的命名模式(例如PVV_25...
    packageimg