找到269个数据集

格式: ZIP 标签: 标注数据

过滤结果
  • ACA_多语言核心论元标注数据库

    2026年2月12日 30 96 31

    数据集概述 本数据集包含英语、老挝语和俄语三种语言的及物从句语料库示例,标注了作为句法主语和宾语(A和P)的核心论元。数据集采用与Alena Witzlack-Makarevich共同开发的编码方案,包含数据库描述文档和三种语言的标注文本文件,总计四个文件,为跨语言句法结构研究提供结构化标注资源。 文件详解 数据库描述文档...
    packageimg
  • 京剧无伴奏清唱音节边界与时值标注zip文件

    2026年2月1日 30 127 54

    数据集概述 本数据集包含京剧专业及业余演唱者无伴奏演唱的音节边界标注与音节时长标注,是相关研究的实验数据。数据集整合了音频文件与标注文件,音频由C4DM Queen Mary University of London和MTG-UPF两所机构录制,标注采用Textgrid和CSV格式,同时提供解析代码。 文件详解...
    packageimg
  • WWW2020_Based_Web表格新实体发现实验复现资源

    2026年2月8日 30 179 158

    数据集概述 本数据集是论文《Novel Entity Discovery from Web Tables》的实验复现资源,包含三个用于Web表格新实体发现、实体类型与提及解析的测试集,以及300万张表格的提及-实体、标题-属性对应关系数据,支持论文中实体链接、表格匹配、实体解析实验的复现。 文件详解 压缩包文件...
    packageimg
  • SniffyArt_Based_历史艺术品嗅觉手势识别数据集

    2026年2月8日 30 126 44

    数据集概述 本数据集为SniffyArt,包含441件历史艺术品中1941个个体的标注信息,每个个体均标注有边界框、17个姿态关键点及手势标签,通过融合五组关键点标注实现高质量人体姿态估计,支持嗅觉手势识别的混合分类方法开发,为历史艺术品中人体手势与嗅觉维度分析提供基础。 文件详解 代码文件 文件名称:download_imgs.py 文件格式:.py...
    packageimg
  • C_SSRS_Based_Reddit用户自杀风险标注数据集

    2026年2月8日 30 124 55

    数据集概述 本数据集包含Reddit平台r/SuicideWatch等心理健康相关子版块用户的自杀风险评估数据。通过哥伦比亚自杀严重程度评定量表(C-SSRS),由领域专家对448名用户标注为支持性、自杀意念、自杀行为、自杀尝试四类标签,标注者间一致性达0.76。数据集含7个文件,覆盖匿名用户帖子及标注信息,为社交媒体自杀风险分析提供支撑。 文件详解...
    packageimg
  • 葡萄园植物健康检测标注数据集_2023_24年

    2026年2月1日 30 49 39

    数据集概述 本数据集包含508张用于葡萄园植物健康状态识别的标注图像,图像从2023-2024年不同日期的DJI Mavic无人机航拍照片中随机选取,涵盖植物生长的多个阶段。数据分为健康、霉菌感染、缺铁三种状态类别,采用YOLOv12格式标注,适用于模型训练与评估。 文件详解 数据集压缩包 文件名称:dataset.zip 文件格式:ZIP...
    packageimg
  • QDSD_Based_量子点稳定性图实验数据_数据集

    2026年1月31日 30 205 175

    数据集概述 本数据集为量子点稳定性图数据集(QDSD),聚合了不同研究团队提供的量子点实验稳定性图数据,包含原始数据、处理后数据及标签文件,可用于离线调优或机器学习任务,目前仅标注了单量子点稳定性图数据。 文件详解 originals.zip 文件格式:ZIP 字段映射介绍:包含从实验人员处获取的原始数据,按来源分组,未经过任何数据处理...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日 30 208 97

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg
  • MAST_rhythm_重新标注子集_音乐节奏评估数据

    2026年1月31日 30 68 4

    数据集概述 本数据集是MAST节奏数据集的子集,包含80个学生节奏表演(对应20个参考音频)的重新标注数据。标注者通过自定义工具对表演进行评分,评分等级分为4(完美)、3(小错误)、2(大错误)、1(完全偏离),旨在为音乐节奏评估提供结构化标注参考。 文件详解 压缩包文件 文件名称:mast_rhythm_reannotated_subset.zip...
    packageimg
  • 矿业_酷刑_缩写_科学文献_数据集_2024年10月28日

    2026年1月29日 30 210 162

    数据集概述 本数据集聚焦科学文献中的“扭曲缩写”挖掘,包含150篇开放获取的工程类文章,旨在识别学术文本中不规范的缩写现象,为检测可疑出版物提供支持。数据集含7个文件,涵盖数据档案、代码脚本、说明文档等多种类型。 文件详解...
    packageimg
  • FG_OVD_Based细粒度开放词汇目标检测基准套件数据

    2026年1月29日 30 21 1

    数据集概述 本数据集是FG-OVD细粒度开放词汇目标检测基准套件,包含PACO图像的标注数据,涵盖对象、部件及属性的自由格式细粒度文本描述,还包括多组负样本描述,用于测试开放词汇模型的细粒度识别能力,共含一个文件。 文件详解 压缩文件 文件名称:lorebianchi98/FG-OVD-v1.zip 文件格式:ZIP...
    packageimg
  • UISGD_Based_UI语义组检测标注数据集_部分发布版

    2026年1月29日 30 145 88

    数据集概述 本数据集是用于UI语义组检测的标注数据集,根据公司协议仅发布部分随机抽取的数据,包含100个样本和1个COCO格式的标注JSON文件,共2个文件,无训练/测试、数据/标签等拆分,可支持UI语义组检测相关研究与模型训练。 文件详解 UISGD.zip 文件格式:ZIP 内容说明:包含100个UI语义组检测的样本数据...
    packageimg
  • Zero_shot_Based_多语言应用评论挖掘标注数据集

    2026年1月29日 30 34 15

    数据集概述 本数据集包含Google Play平台3款健康应用(Garmin Connect、Huawei Health、Samsung...
    packageimg
  • ACL_cite_Based_学术句子引用价值预测标注数据集

    2026年1月29日 30 201 196

    数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
    packageimg
  • 孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集

    2026年1月28日 30 26 10

    数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
    packageimg
  • Aisel_palletdegr_Based图像调色板检测数据集

    2026年1月28日 30 103 100

    数据集概述 本数据集用于图像中的调色板检测,包含匹配的.xml标注文件和.jpg图像文件,标注信息含边界框。调色板通过Unity模拟生成,具有多种退化程度。数据集以压缩包形式提供,共包含一个文件。 文件详解 文件名称:palette.zip 文件格式:ZIP...
    packageimg
  • ChatGPT_Based_自然语言需求不一致性检测评估补充数据

    2026年1月28日 30 91 66

    数据集概述 本数据集为论文《Inconsistencies Detection in Natural Language Requirements using ChatGPT: a Preliminary...
    packageimg
  • DOSS_IITIS_物联网网关UDP_Flood攻击合成数据集

    2026年1月28日 30 30 1

    数据集概述 本数据集是IITIS在DOSS项目中创建的UDP Flood网络攻击合成数据,包含针对物联网网关的攻击数据包和正常数据包,覆盖两台设备(一台被攻陷、一台发送正常流量)的流量数据,标注有真实标签,可用于测试和优化攻击检测与缓解算法。 文件详解 文件名称:UDP_Flood_dataset.xlsx 文件格式:XLSX...
    packageimg
  • BioEsCorpus_西班牙语临床报告生物医学实体关系注释语料库

    2026年1月27日 30 175 47

    数据集概述 本数据集包含对西班牙临床案例语料库(SPACCC)中18份西班牙语临床报告进行生物医学实体与语义关系标注的文件及资源。标注涵盖11类实体和8类语义关系,最终识别出324个实体(涉及10类实体)和170条关系(涉及5类关系),为生物医学文本处理研究提供结构化标注资源。 文件详解 brat_annotations目录...
    packageimg
  • SUN_Spot_Based_RGB_D图像空间指代表达式标注数据集

    2026年1月27日 30 158 132

    数据集概述 本数据集是基于SUNRGBD图像数据集的空间指代表达式(REs)标注数据,用于定位图像中的目标对象。它是唯一使用RGB-D图像的RE数据集,平均空间介词数量更多,场景更杂乱。包含3个文件,无目录结构和数据拆分。 文件详解 instances.json 文件格式:JSON...
    packageimg