-
Muzzle_Cow_牛鼻纹图像分类数据集
2026年2月2日 30 61 41
数据集概述 本数据集为牛鼻纹(Muzzle Cow)图像分类数据集,包含训练集和测试集两个文件夹。训练集含30类共150张牛鼻纹图像,测试集含30类共60张牛鼻纹图像,用于牛个体识别相关的图像分析任务。 文件详解 训练集文件 文件名称:train.zip 文件格式:ZIP 字段映射介绍:压缩包内包含30类牛的鼻纹图像,总计150张,用于模型训练...
-
基于视觉的航天器场景神经网络表示合成数据集
2026年2月1日 30 206 126
数据集概述 本数据集是基于Unity 3D引擎生成的航天器合成图像数据集,包含CubeSat和SMOS两种卫星模型的图像及元数据。通过可控环境生成大量标注数据,解决真实空间数据稀缺问题,支持航天器视觉神经场景表示学习算法的训练与评估。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
-
荷兰传记门户_生物信息_关系抽取_标注数据集
2026年2月1日 0 152 48
数据集概述 本数据集为荷兰传记文本的人工标注关系抽取数据集,包含14类生物信息相关关系,如出生时间、居住地、亲属关系等。数据源自荷兰传记门户,包含测试集数据及说明文档,共2个文件,用于自然语言处理领域的关系抽取任务研究。 文件详解 README.md 文件格式:.md...
-
葡萄园植物健康检测标注数据集_2023_24年
2026年2月1日 30 189 24
数据集概述 本数据集包含508张用于葡萄园植物健康状态识别的标注图像,图像从2023-2024年不同日期的DJI Mavic无人机航拍照片中随机选取,涵盖植物生长的多个阶段。数据分为健康、霉菌感染、缺铁三种状态类别,采用YOLOv12格式标注,适用于模型训练与评估。 文件详解 数据集压缩包 文件名称:dataset.zip 文件格式:ZIP...
-
-
IMDB_Based_50K电影评论情感分类数据集
2026年1月31日 30 18 4
数据集概述 本数据集为IMDB大型电影评论数据集,包含五万条用于自然语言处理或文本分析的电影评论,用于二元情感分类任务。其中训练集和测试集各两万五千条高极性评论,可通过分类或深度学习算法预测正负评论数量。 文件详解 文件名称:IMDB Dataset.csv 文件格式:CSV...
-
-
CNN_Based_浮游生物图像自动分析数据集与代码
2026年1月31日 30 14 1
数据集概述 本数据集包含基于卷积神经网络(CNN)的浮游生物图像自动分析相关的训练库、测试集、验证集及配套脚本程序,来自Luo等人发表于《Limnology and Oceanography Methods》的研究。数据支持浮游生物图像的分类模型训练、阈值过滤设置及混淆矩阵计算,共含9个文件。 文件详解 训练库...
-
PAN25_Based_多作者写作风格变化检测数据集
2026年1月31日 30 122 4
数据集概述 本数据集为PAN@CLEF2025共享任务“多作者写作风格分析”专用数据,核心任务是检测多作者文档中句子级的写作风格变化位置。数据集包含易、中、难三个难度等级,分别对应不同主题多样性的文档,各等级均划分训练、验证、测试集。 文件详解 文件名称:pan25-multi-author-analysis.zip 文件格式:ZIP...
-
Bangla_Based_孟加拉语信息检索测试集数据
2026年1月31日 30 182 28
数据集概述 本数据集为孟加拉语信息检索测试集,包含1182份文档(182份泰戈尔的短篇故事、小说、散文,1000份2013年《普罗托姆·阿洛》报纸文章)、94条不同复杂度的查询及查询-文档相关性判断,填补了孟加拉语信息检索标准数据集的空白。 文件详解 文件名称:README.txt 文件格式:TXT...
-
MTARSI_INNAR_航空图像飞机类型分类数据集
2026年1月31日 30 49 39
数据集概述 本数据集为MTARSI-INNAR,经精心整理确保无交叉污染,包含27类飞机类型的训练集数据、含未见过样本的开发集,以及16类飞机类型的测试集,各集合飞机类型分布均衡,适用于航空、人工智能及图像分析领域的模型训练与评估。 文件详解 压缩包文件 文件名称:MTARSI-INNAR.zip 文件格式:ZIP...
-
BioSample_Based_LLM自动标注评估数据集
2026年1月30日 30 20 18
数据集概述 本数据集用于评估大语言模型(LLMs)对BioSample数据的自动标注能力,包含细胞系本体映射和基因名称提取两类任务的测试数据、金标准及模型输出结果,支持生物样本数据自动化处理的模型性能验证与分析。 文件详解 细胞系本体映射相关文件...
-
-
YogDATA_Based_工业生产线酸奶杯识别标注数据集
2026年1月30日 30 102 4
数据集概述 本数据集为工业实验室生产线中酸奶杯识别任务构建,包含用于训练和评估Mask R-CNN及YOLO v5.0模型的标注图像数据。数据同时提供适用于两种模型的标注格式,支持乳制品生产过程中的自动化质量检测算法开发,包含2个核心文件。 文件详解 Dataset.zip 文件格式:ZIP...
-
CEEC_Based_历史英语拼写规范化人工标注测试集数据
2026年1月30日 30 70 52
数据集概述 本数据集为CEEC语料库历史英语规范化测试集,包含人工生成的三组历史-现代拼写对列表:混合世纪列表、15世纪列表和18世纪列表,每组各100对。历史形式均源自CEEC语料库,总计包含一个文件。 文件详解 文件名称:test_set_of_normalizations.xlsx 文件格式:XLSX...
-
复制包_移动应用可靠性系统映射研究数据_2008_2021
2026年1月29日 30 117 84
数据集概述 本数据集是移动应用可靠性系统映射研究的复制包,包含2008至2021年期间从Scopus、IEEE、ACM等数据库自动检索的论文数据,以及筛选出的论文作者信息、测试集、使用的指标和发表 venue 等文件,共12个文件,支持移动应用可靠性研究的复现与分析。 文件详解 数据文件(.xlsx格式,共10个)...
-
YouTube_RAI_官方频道视频分段数据集_训练测试集
2026年1月29日 30 192 51
数据集概述 本数据集包含YouTube官方RAI频道(https://www.youtube.com/@rai)中时长超过5分钟的视频信息,涵盖视频ID、标题及分段数据。每个视频的分段数据以列表形式记录各章节的开始时间(毫秒)和章节标题,数据集分为训练集与测试集两个不重叠的部分。 文件详解 文件名称:train_yt_over5min.json...
-
Nature_of_EU_Rules_监管语句研究可复现数据
2026年1月29日 30 165 146
数据集概述 本数据集为欧盟立法监管语句量化研究的可复现数据,包含1971-2022年欧盟立法文件中语句的分类训练数据、模型文件及分类结果等,支持其他研究者复现“欧盟规则性质”项目对法规严格性和密度的分析。 文件详解 complete_training_data.csv 文件格式:CSV...
-
Rooftop_Based_屋顶排水口与通风口检测标注数据集
2026年1月29日 30 164 32
数据集概述 本数据集为平屋顶排水口与通风口检测任务的标注数据,基于德国波恩市7.5厘米地面采样距离的高分辨率正射航拍影像,通过CVAT工具手动标注生成,包含740组屋顶影像与对应标注掩码对,按80%/10%/10%随机分为训练、验证和测试集,支持目标检测、语义分割等计算机视觉任务。 文件详解 数据集文件 文件名称:dataset_COCO.zip...
-
ACL_cite_Based_学术句子引用价值预测标注数据集
2026年1月29日 30 209 43
数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...



