数据集 - 海数据

FuseCap_Based_CC3图像描述数据

2026年2月1日 30 45 10

数据集概述本数据集为FuseCap生成的CC3图像描述数据，包含通过FuseCap方法生成的CC3相关图像描述内容，以单一JSON文件形式存储，无训练/测试、数据/标签等划分，整体结构简洁。文件详解文件名称：CC3_FuseCap.json 文件格式：JSON...

ZIP

Charades_STA_Based_语音描述数据集_2024

2026年1月28日 30 156 91

数据集概述本数据集是Charades-STA数据集的扩展，通过"microsoft/speecht5_tts"机器模拟方法将文本转换为音频生成。包含训练、测试音频数据及原始音频压缩包，共3个文件，支持视频定位任务的学术研究，仅限非商业使用。文件详解 train_audio.json 文件格式：JSON...

ZIP

ARASAAC黑白象形图数据集第七部分

2025年12月8日 30 204 44

数据集概述该数据集为ARASAAC黑白象形图系列的第七部分，包含一千张由Sergio Palao创建的黑白PNG格式象形图，覆盖生物学、医学、图像视觉等多领域语义主题，无目录层级与数据划分。文件详解核心文件: 共一千个PNG格式文件，均为黑白象形图，无目录结构文件示例:...

ZIP

利兹蝴蝶数据集

2025年12月4日 30 76 19

数据集概述该数据集包含十种蝴蝶物种的图像、分割掩码和文本描述，总计八百三十二张图像，每类物种图像数量从五十五到一百张不等，为蝴蝶物种识别与多模态分析提供数据支持。文件详解文件名称：leedsbutterfly_dataset_v1.1.zip 文件格式：ZIP压缩包包含内容：十种蝴蝶物种的图像文件每张图像对应的分割掩码文件...

ZIP

图像与文本多模态特征嵌入数据集

2025年10月19日 30 185 35

图像与文本多模态特征嵌入数据集_Image_and_Text_Multimodal_Feature_Embeddings 数据来源：互联网公开数据标签：多模态学习, 图像嵌入, 文本嵌入, 特征提取, 深度学习, 计算机视觉, 自然语言处理, 数据集数据概述：...

ZIP

BLIP图像文本嵌入数据集-ishaaaaan

2025年5月18日 30 119 88

BLIP图像文本嵌入数据集-ishaaaaan 数据来源：互联网公开数据标签：图像文本，嵌入，多模态，自然语言处理，计算机视觉，数据集，深度学习，检索数据概述：该数据集包含BLIP模型生成的图像和文本嵌入向量。主要特征如下：时间跨度：数据无明确时间范围，主要基于BLIP模型的训练和生成过程。...

ZIP

GPT-4Vision图像描述数据集-22万张图像

2025年4月26日 30 118 78

GPT-4Vision图像描述数据集-22万张图像数据来源：互联网公开数据标签：图像描述, GPT-4 Vision, 图像识别, 计算机视觉, 深度学习, 数据集, 图像标注, 跨模态检索数据概述：本数据集名为laion/220k-GPT4Vision-captions-from-LIVIS，是一个专为GPT-4...

ZIP

找到7个数据集

注册成功！