找到23个数据集

标签: 开源数据集

过滤结果
  • OJ_Samples_翻译结果与评估数据集

    2026年2月2日 30 16 6

    数据集概述 本数据集开源了小规模OJ样本及其翻译结果与评估结果,为相关实验提供基础数据支撑。数据集包含1个压缩文件,未划分训练测试集、数据标签集或原始处理集,具体内容可参考README.md。 文件详解 文件名称:oj_samples.zip 文件格式:ZIP...
    packageimg
  • NPM_Based_NPM包可复现性研究数据集

    2026年2月1日 30 171 163

    数据集概述 本数据集为开源数据集,包含通过工具链构建的NPM包相关数据,涵盖diffoscope输出、工具链构建版本及npmjs注册表中的预构建包,共5个文件,用于研究NPM包的可复现性。 文件详解 压缩文件 文件名称:source-code-dataset-collection.zip 文件格式:ZIP 字段映射介绍:包含源代码数据集相关压缩内容...
    packageimg
  • PANDAX_Based_工业系统问答解释数据集

    2026年2月1日 30 18 10

    数据集概述 本数据集为PANDAX(基于专利的工业问答解释数据集),是首个开源工业QAE数据集。数据源自PDF格式的专利文件,聚焦冷却系统、绿色技术(如可再生能源、碳捕获与存储)等工业系统领域,包含一千八百六十个QAE三元组,覆盖系统信息的部分onomy、功能、参数三类问题主题。 文件详解 PDF_patens.zip 文件格式:ZIP...
    packageimg
  • 南非开放式轻型长期能源系统建模技术经济数据集_v2

    2026年1月31日 30 6 2

    数据集概述 本数据集是用于南非共和国长期能源系统建模的开源精简技术经济数据集,涵盖电力供需、进出口、输配电、剩余容量、容量因子、运营寿命、发电技术成本,以及可再生能源潜力和化石燃料储量估算,共包含一个文件。 文件详解 文件名称:Technoeconomic Data RSA (2015-2050) v2.xlsx 文件格式:XLSX...
    packageimg
  • GIR_Based_几何与真实脉冲响应开源数据集_GPLv3

    2026年1月29日 30 187 52

    数据集概述 本数据集为开源几何与真实脉冲响应数据集,包含超过九十万条脉冲响应数据,涉及2952个测量位置与312个表面的声学响应测量结果。数据通过3D打印表面与机器人自动化测量生成,旨在支持计算声学领域中几何与声学参数关系的研究,总计包含937个文件。 文件详解 数据文件(.json格式)...
    packageimg
  • iNaturalist_Based野生蜜蜂图像部位分割标注数据集

    2026年1月28日 30 70 59

    数据集概述 本数据集包含从iNaturalist数据库获取的726张野生蜜蜂研究级图像,涵盖25个物种(其中Bombus magnus仅6张,其余物种各30张),图像均采用CC-BY-NC许可。同时提供JSON格式的部位分割标注文件,标注内容为所有图像中蜜蜂的头部、胸部和腹部区域,标注工具为Label Studio。 文件详解 压缩包文件...
    packageimg
  • nismod_snail_Based_教程配套开放数据集提取包_v0_1

    2026年1月22日 30 53 3

    数据集概述 本数据集是nismod/snail教程v0.1的配套数据资源包,包含从多个开放数据集提取的内容,涵盖洪水灾害地图、加纳行政区划边界、OpenStreetMap提取数据、道路网络、国家边界、QGIS项目文件及分析结果,用于支持教程的实践操作与分析。 文件详解 flood_layer 内容来源:WRI Aqueduct Flood Hazard...
    packageimg
  • Towards_ecosystem_capacity_土壤有机碳稳定能力研究数据集

    2026年1月15日 30 34 15

    数据集概述 本数据集为《Towards an ecosystem capacity to stabilise organic carbon in soils》论文的配套数据,包含两个Excel文件。整合1396个站点的土壤属性数据,及587个站点的RothC模型收敛结果,支持土壤有机碳稳定能力的研究分析。 文件详解 dataset_full.xlsx...
    packageimg
  • Objaverse_1_0_Based_Albia_trikuharria_3D模型与缩略图数据

    2026年1月8日 30 111 32

    数据集概述 本数据集包含与Albia trikuharria相关的3D模型及配套缩略图文件,源自Objaverse 1.0和Sketchfab平台。数据总计6个文件,以JPEG格式缩略图和GLB格式3D模型为主,无目录层级划分,未区分训练/测试、数据/标签等子集,无说明文档或内容预览。 文件详解 3D模型文件...
    packageimg
  • DSLWP业余无线电有效载荷公开数据集v1_0

    2025年12月22日 30 35 19

    数据集概述 本数据集是DSLWP业余无线电有效载荷捕获数据的公开版本。DSLWP是2018年5月发射、2019年7月撞击月球的中国卫星,包含其运行期间的遥测、图像及通信消息等原始数据,为业余无线电及航天数据研究提供支持。 文件详解 文件名称: tammojan/dslwp-data-v1.0.zip(压缩包),包含以下文件和目录:...
    packageimg
  • Umsuka英语_祖鲁语平行语料库

    2025年12月8日 30 181 34

    数据集概述 该数据集是开源高质量英语-祖鲁语平行语料库,涵盖南非本土及国际英语语境,由专业译者翻译构建。包含10000组平行句对(各5000组双向翻译),并从每组中分离1000组作为评估集,祖鲁语评估集经双重翻译以计算人类水平BLEU分数。 文件详解 训练数据文件(CSV格式): zu-en.training.csv:祖鲁语-...
    packageimg
  • 森林目标分割开源数据集_FinnForest

    2025年12月16日 30 65 22

    数据集概述 该数据集为开源森林目标分割数据集,包含三百张覆盖薄雪的冬季森林图像。由DAC团队人工重新标注,修正原始标注不精确问题,提升数据质量,适用于分割任务。 文件详解 文件名称: Zrzut ekranu 2025-01-20 122252.png 文件格式: PNG (.png) 内容说明:...
    packageimg
  • Zenodo_DCASE2024Task7_Based_文本提示环境声音合成完整数据集

    2025年12月7日 30 136 117

    数据集概述 本数据集包含三百一十组音频片段与对应文本提示,音频时长均为四秒。所有内容经人工精心设计,支持环境声音场景合成任务的生成模型开发与评估。数据分为开发集与评估集,结构清晰,可实现对生成模型的可控量化评估。 文件详解 数据集以压缩包形式提供,解压后包含以下目录结构: - 开发集目录(dev/): - audio/:存放开发集的WAV格式音频文件...
    packageimg
  • 开源卫星视频单目标跟踪数据集

    2025年12月6日 30 141 113

    数据集概述 该数据集汇集了卫星视频单目标跟踪领域的最新开源数据,包含不同传感器和平台采集的卫星视频,对车辆、火车、飞机、船只四类目标进行有向边界框标注,支持领域数据共享与研究推进。 文件详解 文件名称:References.png,文件格式:PNG,可能为数据集相关参考文献的图片 文件名称:Open Satellite Video Single...
    packageimg
  • 代码抽象预训练策略复现包_ICSE26

    2025年12月5日 30 199 144

    数据集概述 该数据集是ICSE 26论文《Code Abstraction-based Pre-training Strategy (CAPS)》的复现包,包含论文实验复现所需的说明文档与代码压缩包,为复现基于代码抽象的预训练策略实验提供支持。 文件详解...
    packageimg
  • 目标检测与图像分析数据集

    2025年11月3日 30 192 97

    目标检测与图像分析数据集_Object_Detection_and_Image_Analysis_Dataset 数据来源:互联网公开数据 标签:目标检测, 图像分析, 计算机视觉, 深度学习, 开源数据集, 机器学习, 数据集构建, 模型训练 数据概述:...
    packageimg
  • 印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar

    2025年6月1日 30 86 3

    印地语语音性别分类数据集-通用语音项目-男声vs女声-mp3--vivmankar 数据来源:互联网公开数据 标签:印地语,语音识别,性别分类,语音数据,机器学习,音频,语音,男声,女声,Common Voice,开源数据集 数据概述: 本数据集旨在用于印地语语音的性别分类研究,包含来自Common...
    packageimg
  • 语音情感识别特征数据集SpeechEmotionRecognitionFeatureDataset-qq1623620766

    2025年5月30日 30 116 113

    语音情感识别特征数据集SpeechEmotionRecognitionFeatureDataset-qq1623620766 数据来源:互联网公开数据 标签:语音识别, 情感分析, 机器学习, 特征提取, 语音信号处理, 多模态, 开源数据集, CASIA 数据概述:...
    packageimg
  • 目标检测与图像识别开源数据集ObjectDetectionandImageRecognitionOpenSourceDataset-i2nfinit3y

    2025年5月12日 30 39 28

    目标检测与图像识别开源数据集ObjectDetectionandImageRecognitionOpenSourceDataset-i2nfinit3y 数据来源:互联网公开数据 标签:目标检测, 图像识别, 计算机视觉, 开源数据集, 数据集构建, 深度学习, 数据标注, 数据集 数据概述:...
    packageimg