找到171个数据集

标签: 多模态

过滤结果
  • 图像产品关键信息提取数据集-lameesmohamedmohee

    2025年4月26日   

    图像产品关键信息提取数据集-lameesmohamedmohee 数据来源:互联网公开数据 标签:图像识别,产品信息提取,数据集,深度学习,计算机视觉,自然语言处理,信息抽取,多模态 数据概述: 该数据集包含图像和对应的产品关键信息,旨在用于图像中的产品信息提取任务。主要特征如下: 时间跨度:数据无明确的时间范围,主要关注产品图像和对应信息。...
    packageimg
  • 亚马逊多模态视觉语言模型数据集AmazonMultimodalVisionLanguageModelDataset-resnicksingh

    2025年4月26日   

    亚马逊多模态视觉语言模型数据集AmazonMultimodalVisionLanguageModelDataset-resnicksingh 数据来源:互联网公开数据 标签:多模态,视觉语言,数据集,图像识别,自然语言处理,机器学习,人工智能,亚马逊 数据概述:...
    packageimg
  • YouTube视频分类数据集YouTubeClassificationDataset-nameerkhanjh

    2025年4月26日   

    YouTube视频分类数据集YouTubeClassificationDataset-nameerkhanjh 数据来源:互联网公开数据 标签:视频分类,数据集,机器学习,内容分析,自然语言处理,情感分析,多模态,人工智能 数据概述: 该数据集包含来自YouTube平台的视频数据,记录了视频的分类标签,内容描述,评论等信息。主要特征如下:...
    packageimg
  • 土耳其手语手势识别数据集TurkishSignLanguageHandmarksDataset-yemce55

    2025年4月26日   

    土耳其手语手势识别数据集TurkishSignLanguageHandmarksDataset-yemce55 数据来源:互联网公开数据 标签:手语识别,计算机视觉,数据集,深度学习,视觉识别,人工智能,土耳其语,多模态 数据概述: 该数据集包含土耳其手语的手势标记数据,记录了土耳其手语的各种手势及其对应的标记信息。主要特征如下:...
    packageimg
  • 视频嵌入数据集GetVideoEmbeddingsData-garvk123

    2025年4月26日   

    视频嵌入数据集GetVideoEmbeddingsData-garvk123 数据来源:互联网公开数据 标签:视频分析,数据集,嵌入,机器学习,计算机视觉,视频检索,自然语言处理,多模态 数据概述: 该数据集包含视频及其对应的嵌入向量,旨在用于视频分析,理解和检索任务。主要特征如下:...
    packageimg
  • 数据2024年多模态医学影像数据集MM24-nickb1125

    2025年4月25日   

    2024年多模态医学影像数据集MM24-nickb1125 数据来源:互联网公开数据 标签:医学影像,多模态,数据集,机器学习,图像分析,肿瘤检测,诊断,放射学 数据概述: 该数据集包含来自2024年多模态医学影像挑战赛(MM24)的数据,旨在促进多模态医学影像分析的研究。主要特征如下: 时间跨度:数据记录的时间跨度为2024年。...
    packageimg
  • 情感分析视频数据集-rahulthakur20

    2025年4月25日   

    情感分析视频数据集-rahulthakur20 数据来源:互联网公开数据 标签:情感分析,视频,数据集,自然语言处理,计算机视觉,机器学习,情绪识别,多模态 数据概述: 该数据集包含用于情感分析任务的视频数据,记录了视频内容及对应的情感标签。主要特征如下: 时间跨度:数据集的时间跨度不固定,取决于具体视频内容。...
    packageimg
  • 语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler

    2025年4月25日   

    语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler 数据来源:互联网公开数据 标签:语言模型,视觉识别,数据集,多模态,机器学习,自然语言处理,人工智能,评测数据 数据概述: 该数据集包含来自语言模型与视觉识别技术评测项目的数据,记录了多模态场景下的图像与文本配对信息。主要特征如下:...
    packageimg
  • 微博七模态数据集Weibo7ModesDataSet-ginrawin

    2025年4月25日   

    微博七模态数据集Weibo7ModesDataSet-ginrawin 数据来源:互联网公开数据 标签:微博,数据集,多模态,社交媒体,自然语言处理,图像处理,音频处理 数据概述: 该数据集包含来自微博的七模态数据,记录了用户发布的微博内容及其相关多媒体信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 图像情感分析数据集-a45632

    2025年4月25日   

    图像情感分析数据集-a45632 数据来源:互联网公开数据 标签:图像情感,情感分析,数据集,计算机视觉,深度学习,自然语言处理,多模态,情感识别 数据概述: 该数据集包含图像及其对应的情感标签,用于训练和评估图像情感分析模型。主要特征如下: 时间跨度:数据记录的时间范围不限。 地理范围:数据来源不限,涵盖全球范围的图像。...
    packageimg
  • 情感语音识别数据集RAVDESS-TESS-SAVEE-CREMA-D合并-diveshthakker

    2025年4月25日   

    情感语音识别数据集RAVDESS-TESS-SAVEE-CREMA-D合并-diveshthakker 数据来源:互联网公开数据 标签:语音识别,情感分析,数据集,机器学习,音频处理,情感语音,音频特征,多模态 数据概述: 该数据集整合了来自 RAVDESS,TESS,SAVEE 和 CREMA-D...
    packageimg
  • 情感语音数据库IEMOCAP清洗后数据集-jiten597

    2025年4月24日   

    情感语音数据库IEMOCAP清洗后数据集-jiten597 数据来源:互联网公开数据 标签:情感分析,语音识别,数据集,机器学习,自然语言处理,音频处理,语音情感识别,多模态 数据概述: 该数据集包含经过清洗的IEMOCAP(Interactive Emotional Dyadic Motion...
    packageimg
  • CREMA-D音频特征与文本情感数据集-nytgaming

    2025年4月24日   

    CREMA-D音频特征与文本情感数据集-nytgaming 数据来源:互联网公开数据 标签:情感分析,音频特征,文本分析,多模态,数据集,机器学习,语音识别,情绪识别 数据概述: 该数据集整合了CREMA-D(Crowd-sourced Emotional Movies Actors Dataset)的音频特征和相应的文本转录及情感标签。主要特征如下:...
    packageimg
  • Flickr30K图片描述数据集Flickr30KImageDescriptionDataset-shubhamkhantwal132

    2025年4月24日   

    Flickr30K图片描述数据集Flickr30KImageDescriptionDataset-shubhamkhantwal132 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,图像检索,深度学习,多模态,人工智能 数据概述:...
    packageimg
  • 多模态27数据集Multi-modal27Dataset-latapangtey4

    2025年4月24日   

    多模态27数据集Multi-modal27Dataset-latapangtey4 数据来源:互联网公开数据 标签:多模态,数据集,图像识别,自然语言处理,机器学习,深度学习,计算机视觉,人工智能 数据概述:该数据集包含来自多个来源的多模态数据,记录了图像和文本的关联关系,适用于多模态学习和应用。主要特征如下:...
    packageimg
  • 美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis

    2025年4月24日   

    美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,深度学习,多模态,教育技术,语言学,人工智能 数据概述: 该数据集包含美国手语(ASL)的短语和句子数据,记录了手语表达的视频或图像信息。主要特征如下:...
    packageimg
  • 美国手语识别数据集ASLDatasets-luochaowang

    2025年4月24日   

    美国手语识别数据集ASLDatasets-luochaowang 数据来源:互联网公开数据 标签:手语识别,计算机视觉,数据集,深度学习,图像处理,人工智能,多模态,信号处理 数据概述: 该数据集包含用于美国手语(American Sign Language, ASL)识别的图像和视频数据,记录了不同手势和符号的视觉表现。主要特征如下:...
    packageimg
  • COYO-1K图像嵌入数据集COYO-1KImageEmbeddingsDataset-anantjain1223

    2025年4月23日   

    COYO-1K图像嵌入数据集COYO-1KImageEmbeddingsDataset-anantjain1223 数据来源:互联网公开数据 标签:图像嵌入,深度学习,数据集,计算机视觉,自然语言处理,多模态,图像检索,语义相似性 数据概述: 该数据集包含了由 Sentence Transformers 团队生成的 COYO-1K...
    packageimg
  • Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui

    2025年4月23日   

    Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui 数据来源:互联网公开数据 标签:图像,斯瓦希里语,多模态,自然语言处理,图像描述,数据集,机器翻译,计算机视觉 数据概述:...
    packageimg
  • 机器学习模型评估数据集MELD-alimistro123

    2025年4月23日   

    机器学习模型评估数据集MELD-alimistro123 数据来源:互联网公开数据 标签:情感分析,多模态,数据集,机器学习,自然语言处理,语音识别,文本分析,情感识别 数据概述: 该数据集包含来自MELD项目的情感分析数据,记录了电影场景中对话的情感信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电影场景中的对话。...
    packageimg