找到192个数据集

标签: 算法训练

过滤结果
  • NERdME_Based_命名实体识别任务完整数据集

    2025年12月20日   

    数据集概述 本数据集包含NERdME相关的压缩文件和标注指南文档,为命名实体识别任务提供数据及操作参考,支持相关算法训练或研究分析。 文件详解 文件名称: NERdME.zip 文件格式: ZIP压缩包 内容说明: 包含NERdME相关的原始或处理后的数据文件,具体内容需解压后查看 文件名称:...
    packageimg
  • J_S_巴赫英法组曲带注释乐谱语料库

    2025年12月24日   

    数据集概述 该数据集为J.S.巴赫《英国组曲》与《法国组曲》的带注释乐谱语料库,以压缩包形式存储,包含相关乐谱的标注数据,为古典音乐乐谱分析提供基础资料。 文件详解 文件名称: DCMLab/bach_en_fr_suites-v2.2.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • Parhyale_Based_帕海拉三维图像分割完整数据

    2025年12月24日   

    数据集概述 该数据集包含帕海拉(Parhyale)的三维分割数据,涵盖五十个时间点的三维图像及六个离散时间点的手动标注,修复了此前版本标签ID重复问题,确保每个实例ID唯一。 文件详解 README.pdf:PDF格式文档,提供数据集详细说明...
    packageimg
  • GiantSteps_电子舞曲调式数据集

    2025年12月23日   

    数据集概述 该数据集包含六百个两分钟的电子舞曲(EDM)子流派音频片段,标注有单键标签。聚焦于Beatport平台上存在问题的片段,存在偏差,但可用于测试调式识别系统的鲁棒性。数据由Daniel G. Camhi和Ángel Faraldo分析,包含音高集合描述、调式变化、注释及置信度等信息。 文件详解 压缩文件:...
    packageimg
  • 街道路灯三维模型与缩略图数据集

    2025年12月23日   

    数据集概述 本数据集包含街道路灯相关的三维模型文件和缩略图文件,涵盖不同视角的图片预览与三维模型数据,为街道路灯的数字化展示与分析提供基础资源。 文件详解 三维模型文件: ad8a93bbc2a946bb87de2575036a6a69.glb:GLB格式,包含街道路灯的三维模型数据 缩略图文件:...
    packageimg
  • ChemoDOTS网络服务器数据文件

    2025年12月23日   

    数据集概述 本数据集包含与ChemoDOTS网络服务器相关的文件,涵盖化学功能、化学反应列表及构建模块等内容,为化学信息学研究和药物设计相关工作提供数据支持。 文件详解 文件名称:ChemoDOTS_list_of_chemical_functions.xlsx,格式:xlsx,内容:ChemoDOTS网络服务器识别的化学功能列表及对应的SMILES...
    packageimg
  • 书籍摄影测量数据集

    2025年12月23日   

    数据集概述 本数据集包含通过摄影测量技术生成的书籍三维模型及相关预览图片。使用110张照片经Agisoft Metashape处理得到,为书籍三维数字化展示与建模研究提供基础数据支持。 文件详解 文件类型分布: JPEG格式图片:共5个文件(占比约百分之八十三点三三),为数据集的预览缩略图,如thumb0.jpeg、thumb1.jpeg等...
    packageimg
  • 市场_物体数据集

    2025年12月23日   

    数据集概述 本数据集包含与市场相关的物体数据,主要由图片文件和三维模型文件组成,覆盖两种文件类型,为市场场景或物体的数字化展示与分析提供基础数据支持。 文件详解 图片文件(.jpeg格式,共5个): 具体文件:thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg...
    packageimg
  • 笔记本电脑三维重建数据集2020

    2025年12月23日   

    数据集概述 本数据集包含2020年2月拍摄的笔记本电脑图像及基于该图像生成的三维重建结果,涵盖摄影参数、设备信息、三维重建软件设置及最终输出文件,为笔记本电脑三维模型构建相关研究提供数据支持。 文件详解...
    packageimg
  • 跨主题作者归属大型语料库FICSIT

    2025年12月23日   

    数据集概述 该数据集是精准控制跨主题样本的作者归属语料库,基于StackExchange平台数据构建,包含1237位作者的188077条文本样本,覆盖308个主题,未进行额外预处理,为跨主题作者归属研究提供基础数据。 文件详解 文件名称: FICSIT.zip:压缩包格式,包含跨主题作者归属的文本样本数据,具体字段需解压后查看 文件名称:...
    packageimg
  • 带男性形象和胡须面孔的浮雕三维模型数据集

    2025年12月23日   

    数据集概述 本数据集包含带男性形象和胡须面孔的浮雕三维模型相关数据,涵盖145张iPhone 13 Pro拍摄的图像及RealityCapture处理的模型文件,可用于研究该历史浮雕的数字化复原与展示。 文件详解...
    packageimg
  • 主题建模工具数据集

    2025年12月22日   

    数据集概述 本数据集包含主题建模工具的输出结果,涵盖标准设置数据集与Nword块数据集的分析内容,包含结果表格、频率图表及分类文档,为主题建模相关研究提供结构化与可视化的数据支持。 文件详解 文件名称: Topic Models Chart.xlsx 文件格式: XLSX 内容说明: 可能包含主题建模结果的结构化数据表格,便于统计分析与数据提取...
    packageimg
  • 爱德华_格里格抒情钢琴曲标注乐谱语料库

    2025年12月22日   

    数据集概述 本数据集是爱德华·格里格抒情钢琴曲的标注乐谱语料库,包含经过标注的乐谱资源,以压缩文件形式存储,为音乐分析、乐谱研究等提供数据支持。 文件详解 压缩文件: DCMLab/grieg_lyric_pieces-v2.3.zip: 压缩文件格式,包含爱德华·格里格抒情钢琴曲的标注乐谱语料库相关内容,具体字段或内容需解压后查看 适用场景...
    packageimg
  • 全球众包农田数据参考数据库_Geo_Wiki平台

    2025年12月22日   

    数据集概述 该数据集是通过Geo-Wiki平台众包收集的全球农田参考数据,基于经纬度交点系统抽样,在农田概率25-75%区域增强样本,含约3.6万农田样本。还提供控制数据集(1793个验证点)和专家金标准数据集(60个验证点),用于质量评估,支持农田地图验证与分类算法训练。 文件详解 数据描述文件: _Data description.csv:...
    packageimg
  • 废弃外墙原始扫描数据集

    2025年12月22日   

    数据集概述 本数据集为废弃外墙的原始扫描数据,通过iPhone 12 LiDAR设备采集,包含扫描所得的三维模型文件及配套缩略图,记录了废弃外墙的空间形态信息。 文件详解 三维模型文件: 48b6c531705f49a489e2b08eadf820b0.glb: GLB格式文件,可能存储废弃外墙的三维扫描模型数据 缩略图文件:...
    packageimg
  • 三阴性乳腺癌数据集扩展_脑切片与细胞类型数据集

    2025年12月22日   

    数据集概述 本数据集是三阴性乳腺癌(TNBC)数据集的扩展,补充了细胞类型标注信息,同时新增18张来自TCGA的脑切片标注图像。数据未正式发表,使用需引用指定论文,包含3个压缩文件。 文件详解 TNBC_and_Brain_dataset.zip:ZIP格式压缩文件,包含扩展后的TNBC数据集及新增脑切片图像的基础数据...
    packageimg
  • 中文隐喻语料库

    2025年12月21日   

    数据集概述 该数据集为中文隐喻语料库,包含一个压缩文件,未提供训练/测试、数据/标签、原始/处理数据的划分,主要用于隐喻相关的自然语言处理研究与应用。 文件详解 文件名称: ChineseMetaphorCorpus-metaphor.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • CT扫描肋骨分割数据集RibSeg

    2025年12月21日   

    数据集概述 该数据集为CT扫描肋骨分割的基准数据集RibSeg,包含490例CT扫描数据(对应11,719根肋骨),通过形态学算法生成并人工优化了标注。数据集采用点云技术构建基线方法,提升分割效率,为自动肋骨分割研究提供公开可用的标注数据。 文件详解 文件名称: RibSeg_490_nii.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 情感分析与情绪挖掘实验数据集_情绪挖掘工具包EMTk

    2025年12月21日   

    数据集概述 本数据集为情感分析与情绪挖掘领域的实验数据,随情绪挖掘工具包(EMTk)Docker容器分发。包含Stack Overflow的4000余篇标注帖子及Jira的约4000个标注议题,均为人工标注的情绪与极性数据,可直接用于相关算法训练与验证。 文件详解 文件名称:collab-uniba/EMTK_datasets-v1.0.zip...
    packageimg
  • ITU_AI_ML_挑战赛2021_IEEE_802_11ax_空间复用数据集

    2025年12月21日   

    数据集概述 本数据集为ITU AI/ML挑战赛2021问题设计,包含3000个IEEE 802.11ax部署场景,覆盖不同接入点(AP)、站点(STA)配置及21种OBSS/PD阈值,用于空间复用(SR)操作相关的机器学习与联邦学习算法训练。 文件详解 场景1相关文件:...
    packageimg