-
野草莓检测数据集
数据集概述 该数据集包含用于野草莓检测任务的标注图像,所有图像由OAK-D S2相机拍摄,分辨率为一千四百五十六乘以一千零九十二像素。数据集按训练、验证、测试目录结构组织,每个目录下包含图像文件及对应的PascalVOC和YOLO格式标注文件,为野草莓目标检测模型的训练与评估提供支持。 文件详解 数据集包含一个压缩文件,解压后目录结构如下: -...
-
火星表面图像_好奇号火星车_标注数据集
数据集概述 该数据集包含6691张火星表面图像,覆盖24个类别,由火星科学实验室(MSL,好奇号)火星车通过桅杆相机左右眼及机械臂相机拍摄。图像为约256x256像素的浏览版,按火星日划分为训练、验证和测试集,用于模拟图像存档随时间增长的实际应用场景。 文件详解 压缩包文件: msl-images.zip: 包含所有相关文件的压缩包,文件格式为ZIP...
-
数学主观题手写识别测试集2024
数据集概述 本数据集为数学主观题手写识别测试集,包含五张JPG格式图片,无目录结构,未划分训练测试集、数据标签集及原始处理集,主要用于手写识别相关的模型测试或数据验证。 文件详解...
-
InftyMCCDB_2数学表达式数据集
数据集概述 该数据集是InftyCDB-2的修改版本,包含扫描文章页面中的数学表达式。原始数据含21,056个表达式,经去除矩阵和网格公式后保留19,381个,覆盖213个符号类,按符号与关系类分布划分为训练集(12,551张图像)和测试集(6,830张图像),表达式符号数量平均为7.33个。 文件详解 压缩文件包: LG_test.zip:...
-
基于目标检测网络的细胞检测荧光显微镜数据集
数据集概述 本数据集包含多种细胞类型的荧光显微镜图像及标注,支持目标检测网络训练与分析。涵盖红细胞、神经母细胞瘤等细胞类型,标注由专业人员完成,含训练集与测试集,适用于细胞检测模型开发。 文件详解 文件名称: microvision.zip 文件格式: ZIP压缩包 内容说明:...
-
MEDDOCAN西班牙语临床病例报告匿名化标注数据集
数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
-
OEMC2023欧洲土地覆盖分类数据集
数据集概述 本数据集是OEMC 2023黑客松项目的土地覆盖分类数据,基于LUCAS调查的真实数据分层抽样生成,涵盖2006至2018年共五期数据,包含72个土地覆盖类别。数据结合416个栅格空间图层作为特征,支持机器学习建模。 文件详解 该数据集包含以下文件: -...
-
辅音挑战语料库
数据集概述 该语料库提供用于支持人机辅音识别对比(安静与噪声环境)的数据集。包含二十四名英语母语者(十二女、十二男)的语音数据,覆盖二十四个英语辅音在九种元音环境、两种重音类型下的发音,共一万零三百六十八个语音样本,适用于自动语音识别实验的训练、开发和测试。 文件详解 技术说明文件: readme.pdf:...
-
阿拉伯语语音命令数据集
数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
-
陆生哺乳动物地震脚步声识别数据集
数据集概述 本数据集包含北美四种陆生哺乳动物(黑熊、美洲狮、灰狼、白尾鹿)的地震脚步声录音,数据于大温哥华动物园采集,经处理后用于训练卷积神经网络模型进行物种识别。 文件详解 文件名称: dataset-audio.zip 文件格式: ZIP (.zip) 文件内容:...
-
LivingNER标准语料库_物种病原体食物命名实体识别与分类数据集
数据集概述 该数据集为LivingNER标准语料库,包含训练、验证、测试及背景集,覆盖多医学专科的两千份临床病例报告,标注物种、病原体、人类及食物等实体,并提供多语言资源,用于命名实体识别、归一化及分类任务。 文件详解 核心压缩文件: livingner-...
-
单作者手写删除线数据集
数据集概述 该数据集包含单作者手写文字的清洁版与删除线版配对图像,文字内容取自《德古拉》片段,删除线类型涵盖横线、对角线等七种。数据按删除线类型均衡分为训练、验证、测试子集,支持手写删除线去除任务研究。 文件详解 压缩文件: train.zip:训练集压缩文件,包含训练用的手写文字图像对及对应CSV文件...
-
MUSDB18_Lyrics_Based_多语言歌词扩展文本分析完整数据
数据集概述 本数据集是MUSDB18数据集的歌词标注扩展,包含九十八首训练集歌曲与四十五首测试集歌曲的英文歌词人工转录文本。歌词按三至十二秒自然停顿分段,部分有一秒重叠,提供词音素分解及辅助脚本,适用于文本辅助歌声分离等研究。 文件详解 README.txt: TXT格式,包含数据集说明、使用条款、引用要求、数据结构及文件说明等核心信息...
-
ToxHabits_NER_毒性习惯场景命名实体识别标注数据集
数据集概述 该数据集是西班牙语临床文本中“毒性习惯”命名实体识别的标注数据,聚焦烟草使用、酒精消费、非法药物使用等实体的检测与分类,含训练集和测试集,为临床及流行病学研究提供标注资源。 文件详解 训练集文件: ToxHabits(ToxNER)_Train_ANNFiles.zip:ZIP格式,包含ToxNER任务的训练集标注文件...
-
GraphBin_Tk_Based_微生物群落分箱测试完整数据集_注_因无具体时间信息_所有风格统一使用_完整数据_作为时间后缀_确保涵盖三个模拟数据集及结果的全部内容
数据集概述 该数据集包含GraphBin-Tk手稿的示例数据集和结果,原始数据源自GraphBin2手稿,涵盖三个模拟微生物群落数据集(含5、10、20种细菌),所有数据均通过metaSPAdes组装,支持GraphBin-Tk相关研究。 文件详解 数据集文件: Sim-5G.zip: ZIP格式压缩文件,包含含5种细菌物种的模拟数据集...
-
火星科学实验室好奇号漫游车科学与工程类别图像数据集
数据集概述 本数据集包含火星科学实验室(MSL)好奇号漫游车通过3台仪器拍摄的6820张图像,标注为19个科学与工程相关类别,按火星日范围划分为训练、验证和测试集,所有图像均调整为227×227像素。 文件详解 该数据集核心文件为压缩包 msl-labeled-data-set-v2.1.zip,内部包含以下内容: - 目录与文件: - images...
-
ClinSpEn平行语料库_英语_西班牙语COVID_19临床病例_术语和本体概念数据集
数据集概述 该数据集为ClinSpEn平行语料库,包含英语-西班牙语COVID-19临床病例报告、临床术语及本体概念三类数据,由专业医学翻译人员翻译并经临床专家修订,适用于训练和评估临床机器翻译系统,还提供单语背景数据用于分析系统在未见过数据上的表现。 文件详解 文件名称: clinspen_corpora_complete.zip 文件格式:...
-
空间碎片起源数据集
数据集概述 该数据集是欧洲空间局(ESA)Kelvins竞赛的官方数据,围绕空间碎片起源追踪任务构建。核心内容为空间碎片的轨道参数观测数据,以及对应起源卫星的标识和面积质量比标注,支持通过稀疏观测追溯碎片来源卫星的研究。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: space-debris-the-origin.zip -...
-
STEC感染临床结局预测补充数据集
数据集概述 本数据集为STEC感染临床结局预测相关研究的补充数据,包含测试集分离株结局预测、特征注释、SHAP值、模型超参数调优等多类文件,为分析STEC感染临床结局预测模型提供支持。 文件详解 该数据集包含一个压缩文件,内部包含多个补充数据集,具体说明如下: - 文件名称: STEC_ML_Supplementary_dataset.zip -...
-
草莓数字图像数据集_StrawDI
数据集概述 该数据集包含西班牙韦尔瓦省20个种植园的8000张草莓图像,采集于2018年12月至2019年5月采摘季,覆盖约150公顷区域。图像在真实生产条件下拍摄,包含不同亮度环境、固定距离高度角度的JPEG格式图像,分辨率4032x3024。 文件详解 文件名称:StrawDI_The Strawberry Digital Images Data...



