-
TestWUG_EN_Based_英语词汇使用图测试数据集_v1_2_0
数据集概述 本数据集为英语测试词汇使用图(TestWUG EN),包含人工创建或从现有数据集中选取的特定测试案例,用于词汇语义分析相关测试。数据涉及afternoon_nn、arm、plane_nn、target四个词汇案例,涵盖不同标注来源、使用量、判断数及聚类结构等特征,版本为1.2.0(2023年6月30日)。 文件详解...
-
分子级象鼻虫鉴定项目_西方古北区1300种象鼻虫的条形码数据_2023年
数据集概述 本数据集为Molecular Weevil Identification Project的补充材料3,包含经过严格整理的1300种西古北界象鼻虫(鞘翅目,象鼻虫总科)的条形码数据,以NJ树文件形式封装,支持象鼻虫物种的分子鉴定研究。 文件详解 压缩文件 文件名称:oo_735069.zip 文件格式:ZIP...
-
GNPS_Collection_2020年5月11日获取的碎片质谱数据集
数据集概述 本数据集为2020年5月11日从GNPS平台获取的碎片质谱数据集合,包含154,820条质谱数据,以压缩文件形式存储,可用于代谢组学等领域的质谱数据分析研究。 文件详解 文件名称:ALL_GNPS_20200511.zip 文件格式:ZIP...
-
Instagram_User_Dynamics_社交媒体用户行为分析数据集
数据集概述 本数据集包含随机选取的Instagram用户动态数据,分为主数据集和测试数据集。主数据集涵盖一千名用户(五百名男性、五百名女性),测试数据集涵盖一百名用户(五十名男性、五十名女性)。数据记录了用户的帖子数量、粉丝数、关注数、特定历史帖子的点赞数及自我呈现类帖子数量等核心指标。 文件详解 主数据集文件 文件名称:MainDataset-...
-
Iris_ai_Yewno_信息专家学术搜索系统出声思维测试数据集2021
数据集概述 本数据集包含2021年4-6月针对AI学术搜索系统Iris.ai和Yewno开展的9次信息专家出声思维测试结果。测试经3月预测试与效度验证优化后实施,覆盖5次Iris.ai测试和4次Yewno测试,记录信息专家使用系统时的行为、反馈及任务完成情况,为AI搜索工具评估提供实证数据。 文件详解...
-
BMock12_Community_Standards_LMAS测试数据集
数据集概述 本数据集以BMock12群落标准的12个细菌复制子为参考,包含12种菌株的物种名称、样本ID及覆盖深度信息。原始测序数据源自SRR8073716,经降采样处理保留原样本20%的读数,主要挑战为组装ANIb相似度较高的菌株基因组。数据集包含2个文件。 文件详解 文件名称:README.md 文件格式:MD...
-
Brain_Time_SLIP_UC_San_Diego_脑MRI测试数据
数据集概述 本数据集包含两个文件,分别为用于脑淋巴流动定量的脑MRI T-SLIP测试数据(DICOM格式压缩包)和加州大学圣地亚哥分校研究中每个受试者的拟合结果(匿名化Excel数据),可用于脑MRI影像分析与脑淋巴流动相关研究。 文件详解 Glymphatic_testSET.zip 文件格式:ZIP(压缩包)...
-
iwc_Based_iwc工作流Bionano_VGP7基因组组装测试数据集
数据集概述 本数据集为iwc工作流的测试数据,用于支持Bionano VGP7技术的基因组组装(Scaffolding)流程验证。包含基因组组装所需的输入文件、参数配置文件及Bionano数据文件,共3个文件,覆盖.gfa1、.json、.cmap三种格式。 文件详解 输入GFA文件 文件名称:Input GFA.gfa1 文件格式:.gfa1...
-
OME_Zarr_Source_scMultipleX测试数据集_0_5_0版
数据集概述 本数据集为基于OME-Zarr格式的scMultipleX测试数据,包含0.5.0版本scMultipleX测量的预期值、额外空标签,以及可重建该数据集的Fractal工作流。共含3个文件,支持生物信息领域对OME-Zarr格式数据的测试与验证。 文件详解...
-
Pan_troglodytes_Based_黑猩猩线粒体基因组进化历史研究数据
数据集概述 本数据集包含24个黑猩猩(Pan troglodytes)完整线粒体基因组序列及分析相关文件,用于研究黑猩猩的进化历史。通过贝叶斯框架分析,结合松弛分子钟、化石校准及12个灵长类线粒体基因组,支持黑猩猩4个亚种的分类,并提供各亚种最近共同祖先时间估计,同时包含两种创新分析方法的实现文件。 文件详解 文件名称:chimpanzee-...
-
VinDr_WhatsApp_Chest_X_ray_Test_Dataset
数据集概述 本数据集为VinDr WhatsApp胸部X光测试数据集,包含1个压缩文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据。主要用于医学影像相关的测试场景,为胸部X光影像分析提供数据支持。 文件详解 文件名称:vindr_test_whatsapp.zip 文件格式:.zip...
-
Million_Song_Based_百万当代流行音乐音频特征与元数据研究数据集
数据集概述 本数据集为百万当代流行音乐曲目提供免费可用的音频特征与元数据,是目前音乐研究领域最大的研究数据集,包含与现有资源的关联链接。可用于年预测等研究任务,解决此前因缺乏大量合适数据导致的研究困境。 文件详解 文件名称:mxm_dataset_test.txt.zip 文件格式:ZIP压缩包...
-
M3NSCT5_Based_Stack_Overflow帖子多样化标题生成实验数据集
数据集概述 本数据集是论文“Diverse Title Generation for Stack Overflow Posts with Multiple Sampling Enhanced Transformer”的配套数据,包含训练、验证、测试三类文件,覆盖八种编程语言的Stack...
-
LLM_Based_伦敦国王学院AI驱动Python编译器测试增强数据集2024
数据集概述 本数据集通过整合大语言模型(LLM)与AFL++模糊测试技术生成,用于增强CPython编译器测试。包含由Mistral 7B、Codellama 7B、Gemma 7B等LLM创建的原始Python测试脚本,覆盖多种编译器功能;经模糊测试得到丰富测试用例,可选AFL-...
-
CLEF_Shared_Task_2024_议会辩论意识形态与权力识别测试数据集
数据集概述 本数据集为2024年CLEF议会辩论意识形态与权力识别共享任务的测试集,内容选自ParlaMint语料库(4.0版)的议会演讲文本。数据格式与训练集一致,但未包含标签信息,仅用于任务测试阶段的模型评估,包含1个压缩文件。 文件详解 文件名称:ideology-power-st-testset.zip 文件格式:ZIP...
-
PhasorIdentifier_Based_Phasor_FLIM数据分析测试数据集
数据集概述 本数据集包含用于Phasor Identifier分析的测试数据,支持Python笔记本在Google Colab中的Phasor-FLIM常规分析示例。数据分为细胞代谢分析、药物封装分析及全功能分析三类,涵盖不同实验场景的FLIM信号数据,所有数据采集于80 MHz激光重复频率下。 文件详解 主文件...
-
ICITSI2024_GUI_Programming_Learning_Data_Set
数据集概述 本数据集为ICITSI2024会议相关的GUI编程学习专用数据,包含一个文件,旨在为GUI编程学习者提供结构化学习资源数据,适用于编程教育场景下的学习辅助与实践参考。 文件详解 文件名称:Data Set.xlsx 文件格式:XLSX...
-
ArcheoInf_Project_Based_英国国家书目多格式处理测试数据_2012
数据集概述 本数据集包含英国国家书目(British National Bibliography)的处理后数据,数据状态为2012年2月,由ArcheoInf项目开发的工具生成,用于测试项目搭建的系统。数据以MODS、RDF/XML和Apache-Solr-Add三种格式呈现,原始数据为开放数据。 文件详解 文件名称:bnb.zip 文件格式:ZIP...
-
Ambit_SMIRKS_Based_化学信息学工具SMIRKS转换算法基准对比测试数据
数据集概述 本数据集包含Ambit-SMIRKS与RDKit两款化学信息学工具的SMIRKS转换算法基准测试代码及结果。测试使用545种化合物和84个反应,完成超46000次转换,记录了计算时间、反应位点数量等关键指标,用于对比两款工具的性能差异及化学反应处理能力。 文件详解 输入文件 文件名称:smiles-set.txt 文件格式:TXT...
-
Benchmarking_Based_剪接变体预测算法大规模平行剪接实验测试数据集_2023
数据集概述 本数据集为论文“Benchmarking splice variant prediction algorithms using massively parallel splicing assays”(Smith and Kitzman,...



