-
斯瓦希里语语音识别数据集
2026年3月7日 30 192 79
斯瓦希里语语音识别数据集_Swahili_Speech_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别,斯瓦希里语,语音信号处理,音频分类,多标签分类,非洲语言,声学模型,深度学习 数据概述: 该数据集包含斯瓦希里语(Swahili)的语音数据,旨在用于语音识别和音频分类任务。主要特征如下:...
-
药物活性预测化合物数据集
2026年3月6日 30 145 57
药物活性预测化合物数据集_Drug_Activity_Prediction_Compound_Dataset 数据来源:互联网公开数据 标签:药物研发, 生物活性, 机器学习, 药物筛选, 预测模型, 药物靶点, 深度学习, 多标签分类 数据概述:...
-
心电图疾病诊断分析数据集
2026年3月6日 30 22 6
心电图疾病诊断分析数据集_Electrocardiogram_Disease_Diagnosis_Analysis 数据来源:互联网公开数据 标签:心电图, ECG, 疾病诊断, 机器学习, 深度学习, 图像识别, 多标签分类, 医学影像 数据概述:...
-
互联网评论文本多标签毒性分类数据集
2026年3月5日 30 200 61
互联网评论文本多标签毒性分类数据集_Online_Comment_Text_Multi_label_Toxicity_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 多标签分类, 自然语言处理, 机器学习, 情感分析, 恶意评论, 社区管理 数据概述:...
-
社交平台评论仇恨言论检测数据集
2026年3月3日 30 106 45
社交平台评论仇恨言论检测数据集_Social_Platform_Comment_Hate_Speech_Detection 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 社交媒体, 评论数据, 机器学习, 自然语言处理, 多标签分类 数据概述:...
-
人体跌倒检测图像数据集
2026年3月2日 30 111 62
人体跌倒检测图像数据集_Human_Fall_Detection_Image_Dataset 数据来源:互联网公开数据 标签:跌倒检测, 图像识别, 行为识别, 计算机视觉, 多标签分类, 行人检测, 深度学习, 数据增强 数据概述: 该数据集包含用于人体跌倒检测的图像数据,记录了人体在不同场景下的行为状态。主要特征如下:...
-
人脸属性识别图像数据集
2026年2月22日 30 35 13
人脸属性识别图像数据集_Facial_Attribute_Recognition_Image_Dataset 数据来源:互联网公开数据 标签:人脸识别, 图像分类, 属性分析, 深度学习, 计算机视觉, 图像数据集, 多标签分类, 机器学习 数据概述: 该数据集包含来自公开图像库的人脸图像数据,记录了人脸图像及对应的多种属性标注信息。主要特征如下:...
-
SVM_Based_IPC分类号映射研究领域模型及对照表数据
2026年1月29日 30 180 40
数据集概述 本数据集包含由SVM模型生成的IPC分类号与研究领域的映射模型及对照表,基于专利标题、关键词和摘要构建。数据集共6个文件,包含1个对照表文件和5个机器学习模型文件,用于实现IPC分类号到研究领域的自动化映射。 文件详解 数据文件 文件名称:SVM_RA_IPC.xlsx 文件格式:XLSX...
-
nlp2023_toxic_german_德语新闻评论毒性标注数据集
2026年1月27日 30 2 0
数据集概述 本数据集包含2021年11月4日至10日期间奥地利报纸DerStandard网站的新闻评论数据,共4473条原创评论(排除评论回复),涉及522篇文章。数据包含2818条无毒评论和1655条有毒评论,类别分布相对均衡。每条评论标注了二进制毒性标签,部分评论还包含粗俗语言、目标个体、目标群体、其他目标四类细分标签及文本位置信息。 文件详解...
-
NORMAN_Source_污染物分析仪器方法预测多标签分类器数据集
2026年1月26日 30 184 157
数据集概述 本数据集用于构建多标签分类器,预测新兴污染物分析的最合适仪器方法(LC或GC)。数据基于NORMAN Suspect List Exchange及多机构目标列表(如NKUA、UFZ、WRI等)合并生成,包含化合物SMILES及计算得到的1446个分子描述符、logP和沸点等特征,支撑污染物分析方法的智能预测研究。 文件详解...
-
FSD_MIX_Created_声音事件混合音频剪辑标注数据_2021
2026年1月23日 30 47 19
数据集概述 本数据集为FSD-MIX-CLIPS,是基于FSD-MIX-SED生成的1秒音频剪辑数据集,用于小样本持续学习下的多标签音频分类任务。数据集通过Scaper工具生成,包含614,533条1秒剪辑的标注信息,标注指定了其在FSD-MIX-...
-
DIPROMATS_2024_Shared_Task_2_叙事识别小样本训练数据
2026年1月19日 30 75 53
数据集概述 本数据集是DIPROMATS 2024共享任务2的小样本训练数据,用于叙事识别任务。叙事是指有因果联系的事件序列,在国际关系领域,国际行为体通过战略叙事构建国际政治的过去、现在和未来的共同意义。数据集包含英文和西班牙文两种语言的训练数据,共2个文件。 文件详解 文件名称:dipromats24_t2_train_en_ids.json...
-
Multi_label_Text_Classification_Research_Datasets
2026年1月6日 30 104 72
数据集概述 本数据集包含论文《Adapting Transformers for Multi-Label Text Classification》中使用的三个多标签文本分类数据集,分别为AAPD、Reuters-21578和MFHAD,用于支持多标签文本分类模型的研究与评估。 文件详解 AAPD Dataset 文件名称:AAPD.zip...
-
MuMu多模态音乐多标签分类数据集
2025年12月9日 30 16 7
数据集概述 该数据集是融合亚马逊评论数据集与百万歌曲数据集(MSD)的多模态音乐数据集,通过MusicBrainz完成映射,包含十四万七千二百九十五首歌曲、三万一千四百七十一专辑及四十四万七千五百八十三条用户评论,提供多标签流派标注、专辑元数据、评论信息等,用于多标签音乐流派分类研究。 文件详解 文档文件:...
-
巴西东北部喜剧演员YouTube_Shorts幽默转录标注数据集HuNeBR
2025年12月8日 30 100 32
数据集概述 本数据集包含2022年4月至2024年9月期间,巴西东北部喜剧演员在YouTube Shorts发布的475条幽默文本转录。每条记录含表演场景、原籍州、文化参考、笑点等元数据,以及8种幽默风格的多标签分类和喜剧元素解释,数据经自动化转录与人工编辑,标注流程严谨。 文件详解 文件名称:...
-
数据19世纪美国报纸照片预测图像数据集
2025年12月5日 30 177 99
数据集概述 该数据集包含从美国国会图书馆Chronicling America馆藏报纸中提取的图像,这些图像被预测为照片,并标注有“人类”“动物”“人类结构”“景观”四类标签,为历史报纸视觉内容的计算机视觉研究提供基础数据。 文件详解 图像文件: images.zip:ZIP格式压缩包,包含数据集中的所有图像文件 元数据文件: newspaper-...
-
卫星图像多标签分类数据集
2025年11月19日 30 41 15
卫星图像多标签分类数据集_Satellite_Imagery_Multi_label_Classification_Dataset 数据来源:互联网公开数据 标签:卫星图像, 多标签分类, 遥感, 地物识别, 图像识别, 深度学习, 遥感影像, 数据集 数据概述: 该数据集包含来自 PlanetUAS...
-
遥感影像场景多标签分类数据集
2025年11月8日 30 45 27
遥感影像场景多标签分类数据集_Remote_Sensing_Image_Scene_Multi_label_Classification_Dataset 数据来源:互联网公开数据 标签:遥感影像, 多标签分类, 场景识别, 图像识别, 地物分类, 深度学习, 计算机视觉, 数据集 数据概述:...
-
药物活性预测多模型融合数据集
2025年11月8日 30 202 157
药物活性预测多模型融合数据集_Drug_Activity_Prediction_Multi_Model_Fusion_Dataset 数据来源:互联网公开数据 标签:药物研发, 机器学习, 生物活性, 多标签分类, 模型融合, 预测分析, 药物靶点, 数据挖掘 数据概述:...
-
药物靶点预测化合物活性数据集
2025年10月23日 60 143 126
药物靶点预测化合物活性数据集_Drug_Target_Prediction_Compound_Activity_Dataset 数据来源:互联网公开数据 标签:药物发现, 靶点预测, 化合物活性, 生物信息学, 机器学习, 多标签分类, 深度学习, 高通量筛选 数据概述:...



