找到131个数据集

标签: 生成技术

过滤结果
  • BioASQ_Based_生物医学专家真实需求问答基准数据集

    2026年1月29日 30 209 37

    数据集概述 本数据集为BioASQ生物医学问答基准数据集,包含英文问题、标准参考答案及相关材料,反映生物医学专家真实信息需求,兼具挑战性与实用性。数据集融合结构化与非结构化数据,除精确答案外还包含理想答案(摘要形式),适用于问答系统、多文档摘要、信息检索等多任务研究,且随BioASQ挑战赛持续扩展。 文件详解 README文件 文件名称:README...
    packageimg
  • PREFFECT_Based_FFPE转录组学生成式建模合成数据集

    2026年1月27日 30 81 67

    数据集概述 本数据集包含论文“Generative and integrative modeling for transcriptomics with formalin fixed paraffin embedded...
    packageimg
  • IUCLID_PPP_风险评估_代谢物_遗传毒性_实验证据_整合模板

    2026年1月23日 30 94 25

    数据集概述 本数据集为IUCLID系统中PPP风险评估用的模板文件,核心内容是整合代谢物遗传毒性实验证据的汇总表模板,用于规范代谢物遗传毒性实验数据的整理与提交,支持PPP风险评估中的遗传毒性终点信息管理。 文件详解 文件名称:Template 5.3 - Template summary table integrating experimental...
    packageimg
  • Objaverse_Sketchfab_蓝金竹剑_3D模型及预览图数据

    2026年1月23日 30 40 3

    数据集概述 本数据集包含Blue and Gold Bamboo Katana的3D模型文件及配套预览图,共6个文件,无目录层级。数据源自Objaverse 1.0和Sketchfab平台,主要用于展示该虚拟模型的视觉效果与结构,未划分训练/测试、数据/标签或原始/处理数据类型。 文件详解 3D模型文件...
    packageimg
  • AILabs_tw_Pop1K7_流行钢琴演奏转录数据集_音乐生成研究

    2026年1月22日 30 32 19

    数据集概述 本数据集包含一千七百四十七首西方、日本和韩国流行歌曲的钢琴演奏转录数据,平均每首时长约四分钟,总计一百零八小时。所有曲目均为四四拍,音频已转换为符号序列,支持全曲长度的表现力流行钢琴音乐创作研究。 文件详解 Pop1K7.zip 文件格式:ZIP 字段映射介绍:包含各处理步骤的MIDI文件,以及用于无条件生成任务的REMI和CP表示...
    packageimg
  • CMIP6_Based_IPCC_AR6_图9_6输入数据使用信息记录

    2026年1月22日 30 28 9

    数据集概述 本数据集记录IPCC第六次评估报告第一工作组(IPCC AR6 WGI)图9.6生成所用的CMIP6输入数据使用及引用信息,包含人类可读CSV文件与机器可处理JSON-LD文件,支持数据溯源、引用规范与生成过程的结构化描述。 文件详解 文件名称:fig_9_6.csv 文件格式:CSV...
    packageimg
  • SYN_SE1_Based_WaivOps音乐机器学习开放音频资源数据集

    2026年1月21日 30 193 127

    数据集概述 本数据集为SYN-SE1开放音频数据集,包含Studio Electronics SE1模拟合成器的存档录音,共一千个单音音频样本,以未压缩立体声WAV格式录制,按两个八度范围内的音符键标记。预设涵盖多种合成贝斯和低音主音音色,具备滤波器调制和空间立体声成像特性,适用于音乐相关机器学习应用。 文件详解...
    packageimg
  • NL2Fix_Supplementary_LLM漏洞修复评估补充材料数据

    2026年1月21日 30 50 46

    数据集概述 本数据集是论文“NL2Fix: Evaluating LLMs for Resolving Bugs From Natural Language Intent”的补充材料,包含两个压缩文件,涉及代码漏洞修复相关的嵌入数据和生成补丁数据,为LLM在自然语言意图驱动的漏洞修复任务中的评估提供支持。 文件详解 压缩文件包...
    packageimg
  • CER_UQAC_2023_1326_基于文本生成的用户故事质量提升实验数据

    2026年1月20日 30 101 7

    数据集概述 本数据集包含受控实验CER-UQAC 2023-1326参与者撰写的所有用户故事,旨在支持基于文本生成技术提升用户故事质量的研究。数据集仅含一个文件,无目录层级或数据拆分。 文件详解 文件名称:Participants Results v2.xlsx 文件格式:XLSX...
    packageimg
  • JAZZVAR_Based_爵士钢琴标准曲变奏MIDI数据对_音乐覆盖任务数据集

    2026年1月19日 30 49 33

    数据集概述 本数据集为JAZZVAR数据集,包含502对爵士钢琴标准曲的变奏与原始MIDI片段对。每对变奏片段对应原始标准曲的旋律与和弦片段,区别于传统爵士即兴数据集,专注于手动提取的演奏变奏部分。数据还提供转调至C/Am及所有调式的版本与元数据,支持音乐覆盖等生成任务。 文件详解 JAZZVAR_DATASET.zip 文件格式:ZIP...
    packageimg
  • Pathway2Text_Based_生物医学通路描述生成数据集_NAACL2022

    2026年1月18日 30 160 30

    数据集概述 本数据集包含2367对生物医学通路与文本描述的配对数据,支持自动通路描述生成任务,也适用于Text2Graph和BioNER任务,是NAACL 2022相关论文的配套数据集。 文件详解 文件名称:pathway2text.zip 文件格式:ZIP(压缩包)...
    packageimg
  • arXiv_1812_09293_SUSY最小Dirac_gaugino模型基准点与配套文件

    2026年1月17日 30 75 38

    数据集概述 本数据集包含来自arXiv论文1812.09293的SUSY模型基准点数据及配套资源,涉及2 TeV gluino和2.6 TeV squark质量条件,涵盖SLHA格式基准点文件、UFO与SPheno模型文件、SPheno输入文件及辅助脚本,支持LHC实验中gluinos和squarks限制的研究分析,总计5个压缩文件。 文件详解...
    packageimg
  • curiosity54_Bispectrum_Based双谱简并B8结构及特征生成完整数据集

    2026年1月17日 30 87 73

    数据集概述 本数据集包含四千对双谱简并硼(B8)结构,以及用于生成完整的原子中心(nu=7)和三中心特征的脚本,还提供通过编码器-解码器架构从三中心特征重建nu=7单中心特征、利用这些特征建模结构能量的脚本。 文件详解 压缩文件 文件名称:curiosity54/completeness-three-center-v1.0.1.zip 文件格式:ZIP...
    packageimg
  • Observations_Based_英法俄snowclones句法结构观察数据

    2026年1月15日 30 10 6

    数据集概述 本数据集为硕士论文配套数据,聚焦snowclones(部分填充且具有文化辨识度的句式结构)的句法结构研究,涵盖法语、英语、俄语三种语言,呈现snowclones在词汇变量层面的范式变异及句法形式层面的组合变异。 文件详解 文件名称:Discussion autour de la forme des snowclones.xlsx...
    packageimg
  • listening_to_dreams_Based_鸟类梦境合成研究数据集_综合版

    2026年1月15日 30 14 4

    数据集概述 本数据集为论文“synthesizing avian dreams”配套数据,包含鸟类梦境合成相关的代码、音频、统计文件等11份文件,涵盖合成音频压缩包、数据分析代码、统计表格、原始音频等内容,用于支持鸟类梦境合成主题的研究验证与分析。 文件详解...
    packageimg
  • Webis_ConcluGen_Based_2021结论生成语料库_Patch1_0_1

    2026年1月13日 30 87 36

    数据集概述 本数据集为Webis-ConcluGen-2021结论生成语料库,包含约13万组论证文本与结论配对数据,分为base、topic、targets、aspects四种变体,每种变体含训练、验证、测试文件,还提供自动评估测试集与人工评估用测试集,便于定量与定性分析。 文件详解 文件名称:webis-...
    packageimg
  • 佐治亚州中央烟囱侧面模型数据集

    2025年12月23日 30 146 71

    数据集概述 本数据集包含美国佐治亚州萨凡纳市中央烟囱侧面的三维模型及预览图片。模型需通过16个侧面部件组装完成,提供了烟囱结构的可视化呈现。 文件详解 图片文件(共4个,JPEG格式):thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg,为烟囱侧面模型的预览图。...
    packageimg
  • LICHEN_基于重链和实验需求的轻链免疫球蛋白序列生成数据集与模型权重

    2025年12月23日 30 51 45

    数据集概述 本数据集包含用于机器学习的清洁配对人类抗体序列数据,以及LICHEN模型的权重文件,支持基于重链和实验需求的轻链免疫球蛋白序列生成研究。 文件详解 文件名称: Model.zip:压缩文件,包含LICHEN模型的权重数据 文件名称: Data.zip:压缩文件,包含清洁后的配对人类抗体序列数据 适用场景...
    packageimg
  • 简易椅子低多边形三维模型数据集

    2025年12月23日 30 55 45

    数据集概述 本数据集包含一个低多边形风格的简易椅子三维模型及其配套缩略图,模型以GLB格式存储,辅以五张JPEG格式的缩略图,为三维模型展示与应用提供基础资源。 文件详解 三维模型文件:686c4765cd8c4a36ae92cf7873b3626e.glb,格式为GLB,包含简易椅子的低多边形三维模型数据。...
    packageimg
  • 罗马柱基数据集

    2025年12月23日 30 37 17

    数据集概述 本数据集包含葡萄牙维塞乌主教座堂回廊内的两处罗马时期柱基的数字化资料,推测其源自当地古罗马广场遗址,提供了柱基的三维模型与图片集,支持对罗马建筑构件的数字化研究。 文件详解 核心文件: 4d0fa6cebd23463da02479941dd2ede4.glb:GLB格式的三维模型文件,记录柱基的三维形态数据...
    packageimg