-
STEC感染临床结局预测补充数据集
数据集概述 本数据集为STEC感染临床结局预测相关研究的补充数据,包含测试集分离株结局预测、特征注释、SHAP值、模型超参数调优等多类文件,为分析STEC感染临床结局预测模型提供支持。 文件详解 该数据集包含一个压缩文件,内部包含多个补充数据集,具体说明如下: - 文件名称: STEC_ML_Supplementary_dataset.zip -...
-
草莓数字图像数据集_StrawDI
数据集概述 该数据集包含西班牙韦尔瓦省20个种植园的8000张草莓图像,采集于2018年12月至2019年5月采摘季,覆盖约150公顷区域。图像在真实生产条件下拍摄,包含不同亮度环境、固定距离高度角度的JPEG格式图像,分辨率4032x3024。 文件详解 文件名称:StrawDI_The Strawberry Digital Images Data...
-
智能网联汽车预期功能安全场景生成与分析数据集
数据集概述 本数据集围绕智能网联汽车预期功能安全(SOTIF)场景构建,包含70类危害的定义与分类、场景库建设报告、冲突危害赋值方案,以及多实验场景数据(含随机抽样、ChatGPT4辅助实验等)和场景生成模拟器,为智能驾驶SOTIF测试与算法验证提供支持。 文件详解 该数据集包含文档、数据文件和模拟器工具,具体说明如下: - 文档文件: -...
-
MedProcNER医疗程序命名实体识别金标准标注数据集
数据集概述 该数据集是用于西班牙语医疗文档中临床程序信息抽取的金标准标注资源,包含训练集七百五十份文档、测试集二百五十份文档,以及SNOMED CT编码词表、SNOMED CT与MeSH交叉映射文件,还提供九种语言的银标准版本,为医疗程序检测与实体链接任务提供支持。 文件详解 文件名称:...
-
可操作警告推荐与弱监督学习数据集
数据集概述 该数据集围绕可操作警告的推荐研究构建,包含可操作警告、误报、提交信息、代码变更的原始数据,以及用于两阶段模型训练和测试的数据集,同时提供数据收集、弱监督处理及模型实现的代码。 文件详解 文件名称: Warning.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含以下核心内容 原始数据:...
-
实时手术工具检测轻量级YOLOv8变体数据集及源代码
数据集概述 该数据集包含用于实时手术工具检测的轻量级YOLOv8变体相关数据,涵盖带标注的手术工具图像帧及对应源代码,支持训练与评估,为医疗场景下的实时目标检测研究提供数据基础。 文件详解 文件名称: code.zip 文件格式: ZIP压缩包 内容说明:...
-
从语音到容器_文本转Docker数据集
数据集概述 该数据集包含三千一百九十二个不同的Docker命令样本,每个样本配有对应的自然语言描述(称为"prompt")。数据分为英语版本(含训练、验证、测试集)和西班牙语版本(仅测试集),以压缩包形式提供,为文本转Docker命令的研究提供数据支持。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明:...
-
多语言临床病例报告摘要数据集2025
数据集概述 该数据集为CLEF 2025 BioASQ研讨会MultiClinSum共享任务所用,包含英、西、法、葡四种语言的临床病例报告全文与对应摘要对,分黄金标准训练集、大规模训练集和测试集,支持多语言临床文本自动摘要研究。 文件详解 该数据集包含12个ZIP格式压缩文件,按语言和用途分类如下: - 黄金标准训练集(各语言592对全文与摘要): -...
-
激光指针光斑标注RGB图像数据集
数据集概述 本数据集包含经人工标注的激光指针光斑RGB图像,标注内容为不同材质、颜色表面上的激光光斑边界框。数据集分为训练集与测试对比集,分别由Intel D435相机和智能手机拍摄,支持COCO与YOLO两种格式,适用于激光光斑跟踪相关模型训练。 文件详解 文件名称:...
-
MultiCardioNER语料库_临床命名实体识别系统的心脏病学领域多语言适配数据集
数据集概述 该数据集为MultiCardioNER共享任务语料库,聚焦临床命名实体识别(NER)系统向心脏病学领域的适配。整合DisTEMIST(疾病)、DrugTEMIST(药物)及新标注心脏病临床病例数据,含训练、开发验证与测试集,支持西班牙语疾病识别及多语言药物识别两大任务。 文件详解 文件名称:...
-
入侵检测系统基因优化大规模并行二进制神经网络标记原始数据集
数据集概述 该数据集为入侵检测系统相关研究的标记原始数据,包含NSL-KDD和UNSW-NB15两个公开数据集的原始文件,用于基因优化大规模并行二进制神经网络模型的实验验证,涵盖训练、测试等实验场景的多格式数据文件。 文件详解 数据集包含14个文件,无目录结构,主要文件类型及示例如下:...
-
Context_Trails_Based_多城市情境推荐轨迹数据完整集合
数据集概述 该数据集是用于研究情境化推荐和路线推荐的专用数据,包含纽约、八打灵再也(吉隆坡)、东京三座城市的POI信息、用户轨迹及天气数据。需通过Foursquare API获取POI详情,配套脚本支持数据处理与格式转换,为相关推荐算法研究提供多维度数据支持。 文件详解 该数据集包含多个文件和目录,具体说明如下: - 核心城市数据文件(ZIP格式):...
-
Tough_Tables实体链接评估数据集v3_0
数据集概述 该数据集是用于评估表格数据实体链接方法的基准数据集,支持CEA(单元格实体标注)和CTA(列类型标注)任务。v3.0版本适配DBpedia 2016-10和Wikidata 20220521知识图谱,按验证集和测试集划分,兼容SemTab 2019格式。 文件详解 文件名称: ToughTables-WD_v3.zip 文件格式:...
-
ArtInsight画作劣化检测精确标注数据集
数据集概述 该数据集是针对架上画作劣化检测的精确标注数据集,包含高分辨率画作图像及专家修复师标注的劣化区域,支持人工智能技术在艺术修复领域的应用,已通过Mask-RCNN等模型验证其鲁棒性。 文件详解 文件名称: Dataset.zip 文件格式: ZIP压缩包 内部文件内容: LPL(绘画层缺失空洞)数据:...
-
Aitslab_bioimaging1荧光显微镜核标注数据集
数据集概述 本数据集为荧光显微镜图像基准数据集,含Hoechst 33342染色的细胞核、核碎片及微核标注。图像来自U2OS骨肉瘤细胞系RNA干扰筛选,共50张图像、2000余个标注核对象,预分为训练、开发、测试集,可用于训练细胞核分割神经网络。 文件详解 该数据集包含5个文件,具体说明如下: - 数据文件(压缩包形式): -...
-
SocialDisNER西班牙语推文疾病提及标注数据集
数据集概述 该数据集为SocialDisNER语料库,包含人工标注的西班牙语推文疾病提及金标准数据(训练集5000条、验证集2500条)及自动标注的大规模银标准数据(85000余条推文),覆盖疾病、药物等多类实体,用于研究社交媒体健康内容中的疾病提及识别。 文件详解 主数据压缩包: SocialDisNER_Data.zip 包含training-...
-
WiLI_2018_Wikipedia_Based_多语言文本识别基准数据集
数据集概述 该数据集是Wikipedia语言识别基准数据集,包含235种语言的235000个段落,数据分布均衡,并提供训练集和测试集的划分。 文件详解 文件名称: wili-2018.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内包含数据集的完整内容,具体字段及结构需解压后查看原始文件 适用场景 自然语言处理研究:...
-
COVID_19疫情相关压力感知与心理特质预测数据集
数据集概述 本数据集包含与COVID-19疫情期间心理特质预测压力感知相关的原始数据,支持复现研究论文中的统计分析与机器学习模型结果,含完整数据集、训练/测试集及变量说明文档。 文件详解 文件名称: Dataset.xlsx,文件格式: XLSX 内容: 包含完整数据集、训练集、测试集,用于统计分析与机器学习模型构建 文件名称: COVID-19...
-
Haugen_et_al_2025_Based_水文模型分析完整数据档案
数据集概述 本数据集是Haugen等人2025年研究的代码与数据档案,包含论文相关的分析代码、数据集、结果文件及配置文件,支持论文研究内容的复现与扩展分析。 文件详解 该数据集包含14个文件,具体说明如下: - 代码文件(.ipynb格式,共5个): - FlowDurationCurves.ipynb:流量持续曲线分析代码 -...
-
膀胱内镜组织分类数据集
数据集概述 该数据集包含一千七百五十四张膀胱内镜图像,来自二十三例经尿道膀胱肿瘤切除术患者,图像类型包括白光成像和窄带成像,按组织病理学分析标注为低级别癌、高级别癌、无肿瘤病变、非可疑组织四类,用于多域内镜图像的半监督膀胱组织分类研究。 文件详解 文件名称:baldder_tissue_classification.zip 文件格式:ZIP压缩包...



