找到442个数据集

格式: ZIP 标签: 训练集

过滤结果
  • Vicuna_Based_生物与天然产物端到端关系抽取合成数据集

    2026年2月9日 30 59 54

    数据集概述 本数据集是用于生物与天然产物之间关系端到端抽取的合成训练/验证数据,基于Vicuna-13b-v1.5模型生成,源自LLaMA 2。数据依托GME-sampler提取的生物界前1000篇LOTUS文献参考构建,包含训练集10405项、验证集547项,遵循相关文章所述协议生成。 文件详解 训练集文件 文件名称:train.json...
    packageimg
  • TUT_Acoustic_Scenes_2017_特征数据集

    2026年2月8日 30 36 26

    数据集概述 本数据集包含从15种声学场景的10秒音频片段中提取的特征矩阵,涵盖公交、咖啡馆、城市中心等室内外场景。数据集分为训练集和测试集,训练集每个场景含300个片段,测试集含100个片段,与TUT Acoustic Scenes 2017其他数据集源于同一音频池但片段不同,共3个压缩文件。 文件详解 文件名称:TUT-acoustic-...
    packageimg
  • SniffyArt_Based_历史艺术品嗅觉手势识别数据集

    2026年2月8日 30 207 40

    数据集概述 本数据集为SniffyArt,包含441件历史艺术品中1941个个体的标注信息,每个个体均标注有边界框、17个姿态关键点及手势标签,通过融合五组关键点标注实现高质量人体姿态估计,支持嗅觉手势识别的混合分类方法开发,为历史艺术品中人体手势与嗅觉维度分析提供基础。 文件详解 代码文件 文件名称:download_imgs.py 文件格式:.py...
    packageimg
  • LC_QuAD_2_1_Based_清洗版知识库问答实验数据集

    2026年2月8日 30 79 16

    数据集概述 本数据集是LC-QuAD 2.0的清洗版本,包含移除异常值和重复问题后的知识库问答数据,提供Wikidata和DBpedia 2018的虚拟SPARQL模板,以及论文使用的训练、开发、测试集,含带与不带复述问题的两个训练集,共四个JSON文件。 文件详解 训练集(无复述问题)...
    packageimg
  • Muzzle_Cow_牛鼻纹图像分类数据集

    2026年2月2日 30 194 103

    数据集概述 本数据集为牛鼻纹(Muzzle Cow)图像分类数据集,包含训练集和测试集两个文件夹。训练集含30类共150张牛鼻纹图像,测试集含30类共60张牛鼻纹图像,用于牛个体识别相关的图像分析任务。 文件详解 训练集文件 文件名称:train.zip 文件格式:ZIP 字段映射介绍:压缩包内包含30类牛的鼻纹图像,总计150张,用于模型训练...
    packageimg
  • 基于视觉的航天器场景神经网络表示合成数据集

    2026年2月1日 30 208 103

    数据集概述 本数据集是基于Unity 3D引擎生成的航天器合成图像数据集,包含CubeSat和SMOS两种卫星模型的图像及元数据。通过可控环境生成大量标注数据,解决真实空间数据稀缺问题,支持航天器视觉神经场景表示学习算法的训练与评估。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
    packageimg
  • TopiOCQA_Based_问答处理数据集

    2026年2月1日 30 177 51

    数据集概述 本数据集为TopiOCQA项目的处理数据集,包含18个文件,涉及训练集和验证集数据,涵盖黄金段落信息、检索器数据等内容,支持问答系统相关研究与实验,文件格式以JSON和CSV为主。 文件详解 黄金段落信息文件 目录路径:data/gold_passages_info/...
    packageimg
  • 葡萄园植物健康检测标注数据集_2023_24年

    2026年2月1日 30 81 35

    数据集概述 本数据集包含508张用于葡萄园植物健康状态识别的标注图像,图像从2023-2024年不同日期的DJI Mavic无人机航拍照片中随机选取,涵盖植物生长的多个阶段。数据分为健康、霉菌感染、缺铁三种状态类别,采用YOLOv12格式标注,适用于模型训练与评估。 文件详解 数据集压缩包 文件名称:dataset.zip 文件格式:ZIP...
    packageimg
  • IMDB_Based_50K电影评论情感分类数据集

    2026年1月31日 30 53 28

    数据集概述 本数据集为IMDB大型电影评论数据集,包含五万条用于自然语言处理或文本分析的电影评论,用于二元情感分类任务。其中训练集和测试集各两万五千条高极性评论,可通过分类或深度学习算法预测正负评论数量。 文件详解 文件名称:IMDB Dataset.csv 文件格式:CSV...
    packageimg
  • PAN25_Based_多作者写作风格变化检测数据集

    2026年1月31日 30 26 1

    数据集概述 本数据集为PAN@CLEF2025共享任务“多作者写作风格分析”专用数据,核心任务是检测多作者文档中句子级的写作风格变化位置。数据集包含易、中、难三个难度等级,分别对应不同主题多样性的文档,各等级均划分训练、验证、测试集。 文件详解 文件名称:pan25-multi-author-analysis.zip 文件格式:ZIP...
    packageimg
  • MTARSI_INNAR_航空图像飞机类型分类数据集

    2026年1月31日 30 153 30

    数据集概述 本数据集为MTARSI-INNAR,经精心整理确保无交叉污染,包含27类飞机类型的训练集数据、含未见过样本的开发集,以及16类飞机类型的测试集,各集合飞机类型分布均衡,适用于航空、人工智能及图像分析领域的模型训练与评估。 文件详解 压缩包文件 文件名称:MTARSI-INNAR.zip 文件格式:ZIP...
    packageimg
  • 多语言配对代码与注释变更_代码注释一致性研究数据_zip

    2026年1月30日 30 86 81

    数据集概述 本数据集用于硕士论文“LLMs for Code Comment...
    packageimg
  • YogDATA_Based_工业生产线酸奶杯识别标注数据集

    2026年1月30日 30 104 79

    数据集概述 本数据集为工业实验室生产线中酸奶杯识别任务构建,包含用于训练和评估Mask R-CNN及YOLO v5.0模型的标注图像数据。数据同时提供适用于两种模型的标注格式,支持乳制品生产过程中的自动化质量检测算法开发,包含2个核心文件。 文件详解 Dataset.zip 文件格式:ZIP...
    packageimg
  • YouTube_RAI_官方频道视频分段数据集_训练测试集

    2026年1月29日 30 15 0

    数据集概述 本数据集包含YouTube官方RAI频道(https://www.youtube.com/@rai)中时长超过5分钟的视频信息,涵盖视频ID、标题及分段数据。每个视频的分段数据以列表形式记录各章节的开始时间(毫秒)和章节标题,数据集分为训练集与测试集两个不重叠的部分。 文件详解 文件名称:train_yt_over5min.json...
    packageimg
  • Rooftop_Based_屋顶排水口与通风口检测标注数据集

    2026年1月29日 30 103 100

    数据集概述 本数据集为平屋顶排水口与通风口检测任务的标注数据,基于德国波恩市7.5厘米地面采样距离的高分辨率正射航拍影像,通过CVAT工具手动标注生成,包含740组屋顶影像与对应标注掩码对,按80%/10%/10%随机分为训练、验证和测试集,支持目标检测、语义分割等计算机视觉任务。 文件详解 数据集文件 文件名称:dataset_COCO.zip...
    packageimg
  • ACL_cite_Based_学术句子引用价值预测标注数据集

    2026年1月29日 30 40 19

    数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
    packageimg
  • KLM_Flights_Movies数据集_航班娱乐内容数据

    2026年1月29日 30 63 13

    数据集概述 本数据集包含航班提供的电影标题及链接,可用于获取在线元数据和预告片(不包含视频文件)。数据基于荷兰皇家航空公司(KLM)的电影列表,是2015年2月至4月收集的电影合并集,包含正负样本以确保类别公平性,同时分为训练集和测试集。 文件详解 文件名称:CoE_dataset.zip 文件格式:ZIP...
    packageimg
  • InfoTabS_Based_表格推理可信性证据提取标注数据集

    2026年1月29日 30 82 27

    数据集概述 本数据集为论文配套资源,包含InfoTabS数据集训练集的证据行标注结果、测试集标注结果(源自Gupta et al. 2022)、标注模板及统计信息。标注覆盖16248个训练集表格-假设对,由90名标注者完成81282条标注,多数投票一致性F1值达89.49%,支持可信表格推理的证据提取研究。 文件详解...
    packageimg