-
自然场景下手写文档布局分析基准数据集
数据集概述 该数据集为自然场景下的手写文档布局分析提供基准数据,涵盖不同布局、语言和书写条件的历史与现代手写文档,包含页面分段及对应标签标注,用于评估布局分析方法的泛化能力。 文件详解 文件名称: HDLA-in-the-wild.zip 文件格式: ZIP压缩包 内容说明: 包含自然场景下手写文档布局分析的基准数据,具体文件结构需解压后查看 数据来源...
-
化学实验室仪器数据集
数据集概述 该数据集是高质量的化学实验室仪器基准数据集,包含二十一种类型的化学实验室仪器图像,每种类型不少于二百张,主要为玻璃仪器,所有图像由化学专业学生标注。 文件详解 压缩文件: CLAD.zip:压缩格式(.zip),包含数据集的全部图像文件,涉及二十一种化学实验室仪器类型。 示例图像文件:...
-
路透社21578基准语料库
数据集概述 该数据集为路透社21578基准语料库,是一个用于文本分类等任务的经典基准数据集,以压缩文件形式存储,未提供训练/测试、数据/标签等拆分信息。 文件详解 文件名称: RCV1.zip 文件格式: ZIP压缩包(.zip) 内容说明: 该压缩包包含路透社21578基准语料库的相关数据,无可用内容预览,未检测到命名模式或拆分结构。 适用场景...
-
Parameter_Efficient_Single_Collaborative_Branch_Based_推荐系统参数高效模型实验完整数据
数据集概述 本数据集为论文《Parameter-Efficient Single Collaborative Branch for Recommendation》配套的数据集,包含相关实验数据。数据集以压缩包形式存储,未明确划分训练/测试集、数据/标签或原始/处理数据,整体结构简洁。 文件详解 文件名称: dataset.zip 文件格式: ZIP...
-
基于机器学习原子间势的水相金属盐相互作用改进研究数据集
数据集概述 该数据集包含用于水相砷盐和镁盐水溶液体系的机器学习原子间势(MLIP)训练的数据集与模型,支撑“利用机器学习原子间势改进水相金属盐相互作用”相关研究。 文件详解 文件名称: data.zip 文件格式: ZIP (.zip) 文件内容: 压缩包内包含水相砷盐和镁盐体系MLIP训练的数据集与模型文件,具体字段及结构需解压后查看 适用场景...
-
SMCBenchmark_符号音乐分类模型训练完整数据
数据集概述 该数据集是用于符号音乐分类的SMCBenchmark,包含已处理为npy格式但未量化的数据。涵盖多种音乐分析任务,如流派分类、节拍预测、和弦根音识别等,每个任务对应数据文件与标签文件,为符号音乐理解研究提供标准化基准。 文件详解 数据集为一个压缩文件,具体说明如下: - 文件名称: SMCBenchmark.zip - 文件格式: ZIP...
-
BARC矩形柱体湍流流动DNS研究数据集
数据集概述 本数据集为BARC基准矩形柱体( chord-to-thickness比5:1)绕流的直接数值模拟(DNS)结果,雷诺数(基于柱体厚度和来流速度)设为Re=3000。包含二维平均场、完整雷诺应力集及其单点预算方程相关项,数据以VTK格式存储便于可视化。 文件详解 文件名称: read_me.pdf,文件格式: PDF,内容为数据集说明文档。...
-
AlleNoise大规模文本分类含真实标签噪声基准数据集
数据集概述 该数据集是用于大规模多类别文本分类任务的基准数据集,包含来自Allegro.com的电商产品标题及对应类别标签,标签噪声源于真实电商平台用户行为,同时提供人工验证的清洁标签和层级分类体系。 文件详解 文件名称: data_sheet.pdf 文件格式: PDF (.pdf) 文件内容:...
-
西蒙纳克属与克莱斯托克洛亚族分类样本量影响分析表
数据集概述 该数据集包含一份HTML格式的表格文件,核心内容是关于澳大利亚西蒙纳克属(Simonachne)与克莱斯托克洛亚族(Cleistochloinae)分类研究中,样本量对最高秩判别性状影响的调查结果,基于PATN分析生成的Kruskal-Wallis值排序展开。 文件详解 文件名称: table.html 文件格式: HTML 内容说明:...
-
LYMob_4Cities_多城市人类移动数据集
数据集概述 该数据集包含日本4个未公开名称或位置的大都市区域(城市A、B、C、D)的人类移动数据,覆盖75天、30分钟间隔的500米×500米网格移动轨迹,各城市分别包含10万、2.5万、2万、6千名个体数据,同时提供各网格单元的兴趣点(POI)数据及85类POI分类清单,曾用于HuMob Data Challenge 2024竞赛。 文件详解...
-
MG_PDB和MGBench分子胶水三元结构预测基准数据集
数据集概述 该数据集为MG-PDB & MGBench基准,包含分子胶水(MGs)三元复合物结构数据,用于评估AlphaFold 3等共折叠方法在分子胶水三元结构预测中的性能,支持相关计算方法的基准测试研究。 文件详解 数据文件: data.xlsx: Excel格式文件,可能包含分子胶水三元复合物结构的核心数据信息。 压缩文件:...
-
ESO_Observation_Based_PySME论文光谱补充数据完整集
数据集概述 该数据集为论文《PySME - Spectroscopy Made Easier》的补充数据,包含34个文件,主要为.sme格式的合成光谱文件和.html格式的相关文件,基于欧洲南方天文台多个观测项目的观测数据创建。 文件详解 该数据集包含34个文件,具体说明如下: - 文件类型分布: -...
-
基于日志的自动Thing_Description生成实验结果数据集
数据集概述 本数据集包含利用大型语言模型生成基于日志的自动Thing Description的实验结果,通过单一压缩文件存储相关内容,为研究日志驱动的描述生成技术提供数据支持。 文件详解 文件名称:log-based-td-generator.zip 文件格式:ZIP(.zip) 文件内容:压缩归档文件,具体内部文件结构及内容未提供预览信息 适用场景...
-
CovDocker共价药物设计基准数据集
数据集概述 该数据集是论文《CovDocker: Benchmarking Covalent Drug Design with Tasks, Datasets, and Solutions》的预处理数据,包含共价药物设计相关的蛋白质、配体结构文件及深度学习模型用LMDB文件,支持共价对接相关的三个任务研究。 文件详解 核心目录结构:...
-
教育不公平不平等性AI公平性研究基准数据集
数据集概述 本数据集是专为教育领域AI公平性研究设计的基准数据集,包含处理后数据集、缺失值掩码、元数据等文件,支持提升学生表现、降低辍学率的公平性AI方案开发,推动教育公平。 文件详解 数据集包含一个ZIP压缩文件,内部目录结构及文件说明如下: - 根目录文件:students-dataset.zip(ZIP格式),压缩包内包含以下目录及文件: -...
-
公共需求文档数据集PURE
数据集概述 该数据集包含从网络收集的79份公开自然语言需求文档,共34268个句子,适用于需求工程领域的自然语言处理任务,如模型合成、抽象识别等,可进一步标注为歧义检测等任务的基准。 文件详解 该数据集包含以下文件,具体说明如下: - 压缩文件: - requirements.zip:包含所有PDF格式的需求文档 - requirements-...
-
日本水文建模多模型集成验证数据集_MERV_Jp
数据集概述 该数据集包含日本135个(版本1.1)和87个(版本2.0)流域的气象驱动数据与多模型径流模拟结果,支持日本大样本降雨-径流模拟研究,可作为评估水文建模的基准数据集。 文件详解 文档文件: readme.txt:TXT格式,包含数据集标题、作者信息等基本说明 数据文件:...
-
IJCAI2019_Cause_Effect_Pairs_Based_因果关系基准数据集完整数据
数据集概述 该数据集为因果对基准数据集,包含四组不同来源的因果关系数据文件,最初用于2019年IJCAI会议相关论文,支持文本挖掘回答二元因果问题的评估研究。 文件详解 数据集为压缩包文件,包含以下子文件: - ce_me_benchmark_v1.csv:CSV格式,因果对基准数据文件 -...
-
拟南芥根尖根被膜组织中液泡膜结构数据集
数据集概述 本数据集聚焦拟南芥根尖根被膜组织的液泡膜结构,探究根在琼脂培养基表面与内部位置对液泡膜组织的影响,是用于开发和测试定量描述发育中根组织液泡组结构新指标的基准数据。 文件详解 文件名称: S-BIAD2226.zip 文件格式: ZIP (.zip) 内容说明: 可能包含与拟南芥根尖根被膜液泡膜结构相关的实验数据或原始资料。 文件名称:...
-
语音转换挑战2020数据库v1_0
数据集概述 本数据集为2020年语音转换挑战(VCC 2020)的官方数据库,包含单语种半平行与跨语种语音转换任务的训练、评估数据,以及英文目标说话人参考语音和评估数据转录文本,用于推动语音转换技术的标准化研究与评测。 文件详解 文件名称: nii-yamagishilab/VCC2020-database-v1.0.0.zip 文件格式:...



