-
Trypanosoma_brucei_Based布氏锥虫血液形态分类显微成像数据集
数据集概述 本数据集包含布氏锥虫血液形态(细长型与粗短型)的显微图像及对应标注,用于支持寄生虫生命周期阶段的自动化分类研究。数据覆盖不同图像质量、细胞排列与形态特征,辅以训练/测试/验证划分及模型测试结果文件,适用于寄生虫学、机器学习及计算生物学领域的研究与算法开发。 文件详解 图像数据文件...
-
Ortoimages_Based_卡斯蒂利亚_莱昂古罗马营地遗址识别_CNN训练数据集
数据集概述 本数据集包含来自卡斯蒂利亚-莱昂地区的预处理正射影像,用于训练神经网络以识别田野中的古罗马营地遗址。数据集共8个文件,涵盖元数据、训练/测试/验证集的标注信息及影像压缩包,支持深度学习模型的训练与验证。 文件详解 元数据文件 文件名称:metadata_global.json 文件格式:JSON 字段映射介绍:包含数据集的全局元数据信息...
-
Ungulate_GPS_Telemetry_Based_有蹄类繁殖成功评估辅助数据集
数据集概述 本数据集是论文《Using low-fix rate GPS telemetry to expand estimates of ungulate reproductive success》的辅助分析数据,包含驼鹿不同繁殖状态个体的GPS移动指标、分娩日期记录及分类决策规则结果,涵盖8个文件,支持有蹄类繁殖成功的GPS遥测评估研究。 文件详解...
-
Alive_and_Dead_Trees_Based_哈尔茨山脉多时序遥感单木分类数据集
数据集概述 本数据集包含哈尔茨山脉2009、2016、2022年三个年份的人工标注树冠数据,区分活树与死树,用于单木检测。数据涵盖RGBI航空影像、地面采样距离20厘米的归一化数字表面模型(nDSM)及对应标注,分为训练集和测试集。 文件详解 文件名称:ML_TreeDetection_Harz.zip 文件格式:ZIP...
-
Rapid_Spatio_Temporal_Flood_Modelling论文原始数据集
数据集概述 本数据集为论文“Rapid Spatio-Temporal Flood Modelling via Hydraulics-Based Graph Neural Networks”的原始数据,包含训练和测试模拟所需的地形高程、时间序列水深及速度数据,以及各模拟的数值模型运行时间统计,共一个压缩文件。 文件详解...
-
pKa_Prediction_Non_Aqueous_Solvents_支撑材料_数据集
数据集概述 本数据集为论文“pKa Prediction in Non-Aqueous Solvents”的支撑材料,包含研究中使用的所有化合物的预测与实验pKa值,以及COSMO-RS计算所用构象的.xyz文件,支持非水溶剂中pKa预测模型的验证与分析。 文件详解 数据文件(CSV格式,共5个)...
-
RIMES_Based_ICDAR_2011法语手写识别竞赛行片段数据集_2024公开版
数据集概述 本数据集为2011年ICDAR法语手写识别竞赛第二任务的行片段数据,是RIMES数据库的子集。包含12111行手写文本图像及12107条转录文本,覆盖超87k个单词实例,按标准划分训练、验证和测试集,用于支持手写文本识别研究。 文件详解 文件名称:RIMES-2011-Lines.zip 文件格式:ZIP(压缩包)...
-
GrapevineBunchDetection_Based_葡萄串图像与YOLO标注数据集
数据集概述 本数据集包含葡萄串图像及其YOLO格式标注,图像分辨率为720x540像素。标注文件通过文件名与对应图像关联,定义葡萄串的边界框以标识其区域和位置,同时包含类别映射文件。数据集以压缩包形式存储,适用于葡萄串目标检测任务。 文件详解 压缩包文件:GrapevineBunchDetection.zip 文件格式:ZIP 目录结构:...
-
Corpus_Litterarum_Source_e_codices拉丁手稿字符标注数据集
数据集概述 本数据集是基于e-codices提供的Codices Sangallenses CSG 11和CSG 70两份拉丁手稿构建的行级字符标注数据集。包含2152行图像及44407条字符级标注(共73类),涵盖标准拉丁字母、缩写及抄写符号,采用半自动标注流程。数据按预定义的训练/验证/测试集划分,支持古文字学、手写文本识别及字符分割研究。...
-
Annotated_Desktop_UI_Element_Detection_Dataset
数据集概述 本数据集包含桌面环境的高分辨率截图,专注于标注单个UI组件,旨在提升桌面应用中UI元素识别与分类的准确性,支持层级结构提取。数据分为训练和测试两个压缩包,覆盖PDF阅读器、CRM系统等六类应用场景,含全屏及重叠窗口截图。 文件详解 文件名称:Desktop UI Detection Dataset.zip 文件格式:ZIP...
-
Persian_Socio_cultural_Ontology_用户画像提取与冲突检测数据集
数据集概述 本数据集包含波斯语社会文化本体及冲突检测测试集,本体整合波斯语常识与社会文化信息,支持混合用户画像提取,可获取爱好、职业等个人信息,还能检测用户信息冲突;测试集含一百条冲突与非冲突句子,用于评估冲突检测性能。 文件详解 文件名称:profile_extraction_ontology.rdf 文件格式:RDF...
-
Bangla_License_Plate_Dataset_2_5k_孟加拉车牌检测识别数据集
数据集概述 本数据集包含2519张孟加拉车辆图像,均带有清晰可辨的孟加拉语车牌,分为训练、测试及新增数据三类,提供原始高分辨率与标准化尺寸的车牌图像,适用于车牌检测与识别系统的模型训练和测试。 文件详解 training目录 文件内容:2211张高分辨率孟加拉车牌图像(裁剪自含车牌的车辆图片) 文件格式:jpg 尺寸:可变...
-
Computed_Embeddings_Based_CoV知识图谱RotatE实体关系嵌入数据
数据集概述 本数据集包含基于RotatE模型训练的CoV知识图谱实体与关系嵌入结果,涵盖训练、验证和测试阶段的三元组数据、实体及关系映射、嵌入向量文件、训练日志和配置文件,共10个文件,用于CoV领域知识图谱的表示学习与分析。 文件详解 核心数据文件 文件名称:kg_train.tsv、kg_valid.tsv、kg_test.tsv 文件格式:TSV...
-
Webis_Query_Segmentation_Corpus_2010网络查询分割众包标注数据
数据集概述 本数据集为Webis Query Segmentation Corpus 2010(Webis-QSeC-10),包含53,437条网络查询的分割标注结果,标注由Mechanical...
-
Materials_In_Vessels_Based_化学容器内材料多分类语义分割标注图像数据集2017
数据集概述 本数据集包含一千张实验室场景下透明容器内材料的图像,覆盖不同物相及化学过程,每个像素按四层分类体系标注,用于训练材料识别的神经网络。数据集分为训练集与测试集,测试集含同源与异源YouTube渠道图像,支持模型泛化能力验证。 文件详解 文件名称:Materials_In_Vessels.zip 文件格式:ZIP...
-
LaTeX_English_Wikipedia_英文维基百科LaTeX公式数据_20241123
数据集概述 本数据集为英文维基百科中使用的LaTeX(texvc)输入的公开转储,包含2024年11月23日的标准化输出结果。数据以JSON格式存储,涵盖英文维基百科中的LaTeX公式内容及相关标准化处理数据,共包含2个文件。 文件详解 文件名称:en-wiki-formulae-good.json 文件格式:JSON...
-
Simulation_data_single_screw_extruders_无量纲泵送特性模拟数据
数据集概述 本数据集包含单螺纹单螺杆挤出机无量纲泵送特性的数值模拟数据,按功能分为三个互斥子集:用于构建符号回归模型的训练集(含领域知识整合后的衍生变量)、评估模型插值能力的验证集、评估模型外推能力的测试集。数据以Excel表格形式存储,共1个文件。 文件详解...
-
DUDE_Competition_Based_ICDAR2023文档理解竞赛训练验证测试集真值标注数据
数据集概述 本数据集为ICDAR 2023 DUDE竞赛提供训练、验证和测试集的真值标注,包含41454条标注数据,覆盖4974份文档。数据分为训练集、验证集和测试集,测试集为盲测集(无真值答案),已去除重复数据。 文件详解 文件名称:2023-03-23_DUDE_gt_test_PUBLIC.json 文件格式:JSON 字段映射介绍:...
-
TDWG_2023_Species_Occurrence_Test_Set_生物多样性信息任务评估数据
数据集概述 本数据集是论文《Using ChatGPT with Confidence for Biodiversity-Related Information Tasks》(TDWG 2023...
-
Machine_Learning_Based_机器学习增强RPLC_HRMS非靶向工作流识别概率补充数据
数据集概述 本数据集为机器学习增强RPLC/HRMS非靶向工作流识别概率研究的补充数据,包含5个Excel文件,内容涉及模型训练用化合物列表、累积中性损失质量数据、串联质谱训练数据、RTI预测误差结果及基质匹配验证数据,支撑相关模型的训练与验证。 文件详解 Additional file...



