数据集

模因讽刺检测-人类标注与AI标注对比数据集-2024-sirojiddinboboqulov

模因讽刺检测-人类标注与AI标注对比数据集-2024-sirojiddinboboqulov 数据来源：互联网公开数据标签：模因,讽刺,AI,人类标注,多模态,情感分析,自然语言处理,图像识别,对比分析,解释性AI 数据概述：本数据集扩展了Memotion 7k基准数据集，增加了AI生成的注释和解释，用于讽刺检测。它包含6905个条目，对比了以下内容：人类标注（来自Memotion 7k的原始多模态标签） AI标注，包括多模态（文本+图像）和单模态（仅文本）两种情况模型解释（不超过20个词），用于解释AI的预测结果关键属性： image_name：模因图片的的文件名，例如image_1.jpg text_corrected：转录/清理后的模因文本，例如“LOOK THERE MY FRIEND LIGHTYEAR…” multimodal_annotation_ai：AI讽刺标签（多模态），例如general multimodal_explanation_ai：AI推理（文本+图像），例如“Making fun of Facebook trends…” unimodal_annotation_ai：AI讽刺标签（仅文本），例如twisted_meaning unimodal_explanation_ai：AI推理（仅文本），例如“Uses exaggeration to mock…” multimodal_annotation_humans：原始人类标签，例如general 讽刺类别：general（一般）, twisted_meaning（扭曲含义）, very_twisted（高度扭曲）, non-sarcastic（非讽刺）

数据用途概述：该数据集适用于以下场景：讽刺检测：使用人类/AI标注作为“弱标签”来训练模型。可解释性研究：评估AI解释是否与人类对讽刺的感知相符。模态研究：量化视觉上下文对讽刺检测准确性的影响。数据集结构示例： { "image_name": "image_1.jpg", "text_corrected": "LOOK THERE MY FRIEND…FACEBOOK imgflip.com", "multimodal_annotation_ai": "general", "multimodal_explanation_ai": "Making fun of Facebook trends and followers", "unimodal_annotation_ai": "twisted_meaning", "unimodal_explanation_ai": "The text uses exaggeration to sarcastically mock…", "multimodal_annotation_humans": "general" }

数据与资源

versions_20250406055847.zipZIP
684.97 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	684.97 MiB
最后更新	2025年6月4日
创建于	2025年6月4日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

模因讽刺检测-人类标注与AI标注对比数据集-2024-sirojiddinboboqulov

数据与资源

附加信息

注册成功！