-
FuseCap_Based_CC3图像描述数据
2026年2月1日 30 113 65
数据集概述 本数据集为FuseCap生成的CC3图像描述数据,包含通过FuseCap方法生成的CC3相关图像描述内容,以单一JSON文件形式存储,无训练/测试、数据/标签等划分,整体结构简洁。 文件详解 文件名称:CC3_FuseCap.json 文件格式:JSON...
-
Charades_STA_Based_语音描述数据集_2024
2026年1月28日 30 35 20
数据集概述 本数据集是Charades-STA数据集的扩展,通过"microsoft/speecht5_tts"机器模拟方法将文本转换为音频生成。包含训练、测试音频数据及原始音频压缩包,共3个文件,支持视频定位任务的学术研究,仅限非商业使用。 文件详解 train_audio.json 文件格式:JSON...
-
ARASAAC黑白象形图数据集第七部分
2025年12月8日 30 190 67
数据集概述 该数据集为ARASAAC黑白象形图系列的第七部分,包含一千张由Sergio Palao创建的黑白PNG格式象形图,覆盖生物学、医学、图像视觉等多领域语义主题,无目录层级与数据划分。 文件详解 核心文件: 共一千个PNG格式文件,均为黑白象形图,无目录结构 文件示例:...
-
利兹蝴蝶数据集
2025年12月4日 30 54 18
数据集概述 该数据集包含十种蝴蝶物种的图像、分割掩码和文本描述,总计八百三十二张图像,每类物种图像数量从五十五到一百张不等,为蝴蝶物种识别与多模态分析提供数据支持。 文件详解 文件名称:leedsbutterfly_dataset_v1.1.zip 文件格式:ZIP压缩包 包含内容: 十种蝴蝶物种的图像文件 每张图像对应的分割掩码文件...
-
图像与文本多模态特征嵌入数据集
2025年10月19日 30 195 20
图像与文本多模态特征嵌入数据集_Image_and_Text_Multimodal_Feature_Embeddings 数据来源:互联网公开数据 标签:多模态学习, 图像嵌入, 文本嵌入, 特征提取, 深度学习, 计算机视觉, 自然语言处理, 数据集 数据概述:...
-
BLIP图像文本嵌入数据集-ishaaaaan
2025年5月18日 30 137 24
BLIP图像文本嵌入数据集-ishaaaaan 数据来源:互联网公开数据 标签:图像文本,嵌入,多模态,自然语言处理,计算机视觉,数据集,深度学习,检索 数据概述: 该数据集包含BLIP模型生成的图像和文本嵌入向量。主要特征如下: 时间跨度:数据无明确时间范围,主要基于BLIP模型的训练和生成过程。...
-
GPT-4Vision图像描述数据集-22万张图像
2025年4月26日 30 165 7
GPT-4Vision图像描述数据集-22万张图像 数据来源:互联网公开数据 标签:图像描述, GPT-4 Vision, 图像识别, 计算机视觉, 深度学习, 数据集, 图像标注, 跨模态检索 数据概述: 本数据集名为laion/220k-GPT4Vision-captions-from-LIVIS,是一个专为GPT-4...



