模因讽刺检测-人类标注与AI标注对比数据集-2024-sirojiddinboboqulov

模因讽刺检测-人类标注与AI标注对比数据集-2024-sirojiddinboboqulov 数据来源:互联网公开数据 标签:模因,讽刺,AI,人类标注,多模态,情感分析,自然语言处理,图像识别,对比分析,解释性AI 数据概述: 本数据集扩展了Memotion 7k基准数据集,增加了AI生成的注释和解释,用于讽刺检测。它包含6905个条目,对比了以下内容: 人类标注(来自Memotion 7k的原始多模态标签) AI标注,包括多模态(文本+图像)和单模态(仅文本)两种情况 模型解释(不超过20个词),用于解释AI的预测结果 关键属性: image_name:模因图片的的文件名,例如image_1.jpg text_corrected:转录/清理后的模因文本,例如“LOOK THERE MY FRIEND LIGHTYEAR…” multimodal_annotation_ai:AI讽刺标签(多模态),例如general multimodal_explanation_ai:AI推理(文本+图像),例如“Making fun of Facebook trends…” unimodal_annotation_ai:AI讽刺标签(仅文本),例如twisted_meaning unimodal_explanation_ai:AI推理(仅文本),例如“Uses exaggeration to mock…” multimodal_annotation_humans:原始人类标签,例如general 讽刺类别:general(一般), twisted_meaning(扭曲含义), very_twisted(高度扭曲), non-sarcastic(非讽刺)

数据用途概述: 该数据集适用于以下场景: 讽刺检测:使用人类/AI标注作为“弱标签”来训练模型。 可解释性研究:评估AI解释是否与人类对讽刺的感知相符。 模态研究:量化视觉上下文对讽刺检测准确性的影响。 数据集结构示例: { "image_name": "image_1.jpg", "text_corrected": "LOOK THERE MY FRIEND…FACEBOOK imgflip.com", "multimodal_annotation_ai": "general", "multimodal_explanation_ai": "Making fun of Facebook trends and followers", "unimodal_annotation_ai": "twisted_meaning", "unimodal_explanation_ai": "The text uses exaggeration to sarcastically mock…", "multimodal_annotation_humans": "general" }

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 684.97 MiB
最后更新 2025年6月4日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。