找到356个数据集

标签: 训练集

过滤结果
  • 野草莓检测数据集

    2025年12月19日   

    数据集概述 该数据集包含用于野草莓检测任务的标注图像,所有图像由OAK-D S2相机拍摄,分辨率为一千四百五十六乘以一千零九十二像素。数据集按训练、验证、测试目录结构组织,每个目录下包含图像文件及对应的PascalVOC和YOLO格式标注文件,为野草莓目标检测模型的训练与评估提供支持。 文件详解 数据集包含一个压缩文件,解压后目录结构如下: -...
    packageimg
  • 火星表面图像_好奇号火星车_标注数据集

    2025年12月18日   

    数据集概述 该数据集包含6691张火星表面图像,覆盖24个类别,由火星科学实验室(MSL,好奇号)火星车通过桅杆相机左右眼及机械臂相机拍摄。图像为约256x256像素的浏览版,按火星日划分为训练、验证和测试集,用于模拟图像存档随时间增长的实际应用场景。 文件详解 压缩包文件: msl-images.zip: 包含所有相关文件的压缩包,文件格式为ZIP...
    packageimg
  • 互变异构体对_cheminformatics_处理及_QSAR_QSPR_建模影响研究数据集

    2025年12月18日   

    数据集概述 本数据集为研究互变异构体对化学信息学处理及QSAR/QSPR建模影响的补充材料,包含互变异构体生成、指纹计算、模型应用与构建相关的多类型文件,支持探索互变异构体对建模全流程的作用。 文件详解 互变异构体生成文件: methimazole_tautomers.smi:SMI格式,含甲巯咪唑的互变异构体SMILES线性表示 指纹计算结果文件:...
    packageimg
  • InftyMCCDB_2数学表达式数据集

    2025年12月18日   

    数据集概述 该数据集是InftyCDB-2的修改版本,包含扫描文章页面中的数学表达式。原始数据含21,056个表达式,经去除矩阵和网格公式后保留19,381个,覆盖213个符号类,按符号与关系类分布划分为训练集(12,551张图像)和测试集(6,830张图像),表达式符号数量平均为7.33个。 文件详解 压缩文件包: LG_test.zip:...
    packageimg
  • 基于目标检测网络的细胞检测荧光显微镜数据集

    2025年12月9日   

    数据集概述 本数据集包含多种细胞类型的荧光显微镜图像及标注,支持目标检测网络训练与分析。涵盖红细胞、神经母细胞瘤等细胞类型,标注由专业人员完成,含训练集与测试集,适用于细胞检测模型开发。 文件详解 文件名称: microvision.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • MEDDOCAN西班牙语临床病例报告匿名化标注数据集

    2025年12月16日   

    数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • OEMC2023欧洲土地覆盖分类数据集

    2025年12月16日   

    数据集概述 本数据集是OEMC 2023黑客松项目的土地覆盖分类数据,基于LUCAS调查的真实数据分层抽样生成,涵盖2006至2018年共五期数据,包含72个土地覆盖类别。数据结合416个栅格空间图层作为特征,支持机器学习建模。 文件详解 该数据集包含以下文件: -...
    packageimg
  • BioDCASE2025任务3生物声学微型硬件开发数据集

    2025年12月16日   

    数据集概述 本数据集是BioDCASE 2025任务3的开发集,包含约2小时37分钟的音频记录,核心为黄鹀鸣声在不同环境、距离下的回放与原录音,以及其他物种鸣声和背景噪声的负样本,按训练集、验证集分类存储。 文件详解 根目录文件: Development_Set.zip:压缩包,包含训练集与验证集的音频文件...
    packageimg
  • 阿拉伯语语音命令数据集

    2025年12月16日   

    数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
    packageimg
  • 陆生哺乳动物地震脚步声识别数据集

    2025年12月15日   

    数据集概述 本数据集包含北美四种陆生哺乳动物(黑熊、美洲狮、灰狼、白尾鹿)的地震脚步声录音,数据于大温哥华动物园采集,经处理后用于训练卷积神经网络模型进行物种识别。 文件详解 文件名称: dataset-audio.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • LivingNER标准语料库_物种病原体食物命名实体识别与分类数据集

    2025年12月15日   

    数据集概述 该数据集为LivingNER标准语料库,包含训练、验证、测试及背景集,覆盖多医学专科的两千份临床病例报告,标注物种、病原体、人类及食物等实体,并提供多语言资源,用于命名实体识别、归一化及分类任务。 文件详解 核心压缩文件: livingner-...
    packageimg
  • 单作者手写删除线数据集

    2025年12月15日   

    数据集概述 该数据集包含单作者手写文字的清洁版与删除线版配对图像,文字内容取自《德古拉》片段,删除线类型涵盖横线、对角线等七种。数据按删除线类型均衡分为训练、验证、测试子集,支持手写删除线去除任务研究。 文件详解 压缩文件: train.zip:训练集压缩文件,包含训练用的手写文字图像对及对应CSV文件...
    packageimg
  • 碳纳米管限制碳炔的非谐效应与振动特性相互作用数据集

    2025年12月15日   

    数据集概述 该数据集为研究碳纳米管限制下碳炔的非谐效应与振动特性相互作用的代码数据,包含GAP势函数训练、验证数据及评估代码,支持相关计算模拟分析。 文件详解 目录及内容: gap_global目录:含训练集、验证集、全局GAP势函数文件gap.xml(最后一行打印GAP拟合输入文件)...
    packageimg
  • MUSDB18_Lyrics_Based_多语言歌词扩展文本分析完整数据

    2025年12月15日   

    数据集概述 本数据集是MUSDB18数据集的歌词标注扩展,包含九十八首训练集歌曲与四十五首测试集歌曲的英文歌词人工转录文本。歌词按三至十二秒自然停顿分段,部分有一秒重叠,提供词音素分解及辅助脚本,适用于文本辅助歌声分离等研究。 文件详解 README.txt: TXT格式,包含数据集说明、使用条款、引用要求、数据结构及文件说明等核心信息...
    packageimg
  • ToxHabits_NER_毒性习惯场景命名实体识别标注数据集

    2025年12月15日   

    数据集概述 该数据集是西班牙语临床文本中“毒性习惯”命名实体识别的标注数据,聚焦烟草使用、酒精消费、非法药物使用等实体的检测与分类,含训练集和测试集,为临床及流行病学研究提供标注资源。 文件详解 训练集文件: ToxHabits(ToxNER)_Train_ANNFiles.zip:ZIP格式,包含ToxNER任务的训练集标注文件...
    packageimg
  • 火星科学实验室好奇号漫游车科学与工程类别图像数据集

    2025年12月14日   

    数据集概述 本数据集包含火星科学实验室(MSL)好奇号漫游车通过3台仪器拍摄的6820张图像,标注为19个科学与工程相关类别,按火星日范围划分为训练、验证和测试集,所有图像均调整为227×227像素。 文件详解 该数据集核心文件为压缩包 msl-labeled-data-set-v2.1.zip,内部包含以下内容: - 目录与文件: - images...
    packageimg
  • 国际象棋棋子图像分类数据集

    2025年12月14日   

    数据集概述 本数据集为用于图像分类任务的国际象棋棋子图像数据集,包含四套不同的国际象棋棋子,其中三套用于训练,剩余一套用于验证。所有棋子由固定的俯视摄像头从棋盘的64个方格拍摄,覆盖棋子的所有角度,为图像分类模型训练提供多角度图像数据支持。 文件详解 文件名称: chess_pieces.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • 语音情感合成数据库

    2025年12月14日   

    数据集概述 本数据集为公开的语音情感合成数据库,包含基于双音素合成器规则操控生成的三种基本情绪及中性表达的合成语音数据,经机器学习实验验证可用于训练自然语音情感识别模型。 文件详解 文件名称: syntact_cat.zip 文件格式: ZIP压缩包 内容说明: 包含用于语音情感识别的合成语音数据,具体文件结构需解压后查看 适用场景 语音情感识别研究:...
    packageimg
  • 波士顿新生儿缺氧缺血性脑病脑损伤数据集第一部分_2023

    2025年12月14日   

    数据集概述 本数据集是首个公开的新生儿缺氧缺血性脑病(HIE)脑损伤数据集,包含一百三十三名HIE患儿的弥散MRI影像及专家标注的病灶数据。HIE病灶多为弥漫性小病灶(超半数患者病灶占脑体积不足百分之一),其分割任务比脑肿瘤等局灶性大病灶更具挑战性,旨在推动HIE及小弥散病灶MRI分割方法的发展。 文件详解 文件名称:Readme 文件格式:无扩展名...
    packageimg
  • 空间碎片起源数据集

    2025年12月14日   

    数据集概述 该数据集是欧洲空间局(ESA)Kelvins竞赛的官方数据,围绕空间碎片起源追踪任务构建。核心内容为空间碎片的轨道参数观测数据,以及对应起源卫星的标识和面积质量比标注,支持通过稀疏观测追溯碎片来源卫星的研究。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: space-debris-the-origin.zip -...
    packageimg