泰米尔语表情包恶意内容分类数据集

数据集概述

本数据集是针对泰米尔语表情包的恶意内容分类资源,包含标注为“恶意”和“非恶意”的表情包图像,以及对应的拉丁转写文本,旨在支持印度语言表情包恶意内容的计算建模研究。

文件详解

  • 文件名称: Tamil_troll_memes-dataset.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 压缩包内包含泰米尔语表情包恶意内容分类数据集,具体包含标注为“troll”(恶意)或“not_troll”(非恶意)的表情包图像,以及表情包中的文本拉丁转写内容。

适用场景

  • 自然语言处理研究: 用于泰米尔语表情包恶意内容检测模型的训练与评估
  • 社交媒体内容审核: 辅助构建泰米尔语社交媒体平台的恶意表情包自动识别系统
  • 多模态内容分析: 探究图像与文本结合的恶意内容传播特征
  • 印度语言计算语言学: 支持区域语言社交媒体内容安全相关的算法研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 310.92 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。