-
孟加拉语宗教仇恨评论检测平衡语料库_孟加拉国与印度
2025年11月29日 30 46 44
数据集概述 该数据集是针对孟加拉国和印度的孟加拉语宗教仇恨评论检测构建的平衡语料库,包含针对印度教和穆斯林群体的仇恨言论,来源于社交媒体、新闻及评论区等渠道,用于仇恨言论检测模型开发及相关社会研究。 文件详解 目录:ReligiHate A Balanced Corpus for Religious Hate Co/...
-
孟加拉语攻击性与致命文本数据集
2025年11月28日 30 60 13
数据集概述 该数据集为用于识别和分类文本攻击性的孟加拉语数据集,包含四千零二十七条正式与非正式文本,按仇恨言论、破坏行为、暴行、无攻击性四类标注,附英文翻译,经多阶段预处理及双标注员标注、专家复核,为孟加拉语自然语言处理社区提供内容审核研究支持。 文件详解 文件名称:BOLT.xlsx 文件格式:Excel (.xlsx) 字段映射: Final...
-
马来语_英语双语社交媒体仇恨言论检测数据集
2025年11月28日 30 179 177
数据集概述 本数据集包含两万六千九百八十五条马来语和英语的社交媒体帖子,用于二元仇恨言论检测任务。数据来自五个公开来源,经预处理后标注为仇恨或非仇恨类别,语言分布均衡,适用于多语言及低资源仇恨言论检测模型的训练与评估。 文件详解 说明文档: README.txt:TXT格式,介绍数据集的基本信息、来源及文件结构。 数据文件:...
-
基于女性主义的孟加拉语辱骂性语言数据集
2025年11月27日 30 137 51
数据集概述 该数据集包含从Facebook、Instagram、Twitter等社交媒体平台收集的6830条孟加拉语评论,聚焦女性主义议题与性别相关讨论,由母语者手动标注为正面、负面(辱骂性)或中性,用于低资源语言的仇恨言论分析、辱骂语言识别等研究。 文件详解 文件名称:Bengali Abusive Language Based on...
-
BOISHOMMO_多标签孟加拉语仇恨言论数据集
2025年11月26日 30 207 147
数据集概述 该数据集针对孟加拉语等低资源语言缺乏仇恨言论数据集的问题,构建了包含两千余个标注样本的多标签仇恨言论数据集BOISHOMMO,覆盖种族、性别、宗教、政治等类别,支持孟加拉语仇恨言论检测研究。 文件详解 文件名称:Bengali Heatspeech dataset.csv 文件格式:CSV(.csv)...
-
数据2020年美国大选推特选举舞弊言论数据集-paultimothymooney
2025年5月31日 30 151 53
2020年美国大选推特选举舞弊言论数据集-paultimothymooney 数据来源:互联网公开数据 标签:推特,社交媒体,选举舞弊,美国大选,政治,言论分析,数据挖掘,谣言传播,文本分析 数据概述: 本数据集收录了2020年美国大选期间,推特(Twitter)平台上与选举舞弊相关的言论数据。...
-
Reddit反新冠政策讨论社区内容分析数据集-r-NoNewNormal-2020年
2025年5月5日 30 77 53
Reddit反新冠政策讨论社区内容分析数据集-r-NoNewNormal-2020年 数据来源:互联网公开数据 标签:新冠疫情,Reddit,社交媒体,言论分析,疫苗,封锁,阴谋论,情感分析,文本挖掘 数据概述:...
-
社交多注释者标注的英文仇恨言论数据集
2025年4月26日 30 197 77
社交多注释者标注的英文仇恨言论数据集 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,情感分析,社会研究,机器学习,言论分析,多层次标注 数据集简介: 本数据集由 Kennedy...
-
数据2022年推特葡萄牙语中关于纳粹主义言论数据集Tweets-em-pt-com-a-expresso-nazismo-de-2022-leticiat
2025年4月25日 30 21 7
2022年推特葡萄牙语中关于纳粹主义言论数据集Tweets-em-pt-com-a-expresso-nazismo-de-2022-leticiat 数据来源:互联网公开数据 标签:推特,葡萄牙语,纳粹主义,言论分析,社交媒体,文本挖掘,情感分析,政治 数据概述:...
-
社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel
2025年4月24日 30 191 186
社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel 数据来源:互联网公开数据 标签:种族歧视,言论分析,自然语言处理,数据集,文本分类,情感分析,社交媒体,人工智能 数据概述: 该数据集包含来自社交媒体平台的种族歧视言论数据,旨在用于研究和分析种族歧视言论的识别与处理。主要特征如下:...
-
美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh
2025年4月24日 30 170 90
美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh 数据来源:互联网公开数据 标签:事实核查,言论真实性,美国,政治,新闻,数据,分析,NLP 数据概述:...
-
特朗普Facebook公开状态更新数据集-2017年1月至2021年1月-jinbonnie
2025年4月24日 30 96 0
特朗普Facebook公开状态更新数据集-2017年1月至2021年1月-jinbonnie 数据来源:互联网公开数据 标签:特朗普,Facebook,社交媒体,政治人物,美国大选,言论分析,公开数据,政治,时事 数据概述:...
-
唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012
2025年4月23日 30 190 49
唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012 数据来源:互联网公开数据 标签:推特,社交媒体,政治,特朗普,言论分析,文本数据,舆情,时序分析 数据概述: 本数据集收录了自2009年5月至2019年5月期间,美国前总统唐纳德·特朗普在推特平台上发布的所有推文内容,共计约十年时间跨度。...
-
社交平台可疑言论检测数据集-Twitter与Facebook-2024-syedabbasraza
2025年4月23日 30 32 18
社交平台可疑言论检测数据集-Twitter与Facebook-2024-syedabbasraza 数据来源:互联网公开数据 标签:社交媒体,言论分析,仇恨言论,网络欺凌,文本挖掘,情感分析,Twitter,Facebook,恶意内容检测 数据概述:...
-
特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi
2025年4月22日 30 22 3
特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi 数据来源:互联网公开数据 标签:特朗普,政治,集会,演讲稿,文本,NLP,自然语言处理,美国大选,言论分析,数据挖掘 数据概述:...
-
美国总统失误言论数据集1960-2023-anoopjohny
2025年4月22日 30 79 57
美国总统失误言论数据集1960-2023-anoopjohny 数据来源:互联网公开数据 标签:总统失误,政治笑话,言论分析,历史事件,领导力,幽默,公共言论,政治文化 数据概述:...
-
特朗普推特内容数据集-2009至2020年-ironicninja
2025年4月22日 30 20 15
特朗普推特内容数据集-2009至2020年-ironicninja 数据来源:互联网公开数据 标签:特朗普,推特,社交媒体,政治,言论分析,时间序列,数据挖掘 数据概述:...
-
美国前总统特朗普推文内容分析数据集-2024年至今-gpreda
2025年4月22日 30 135 8
美国前总统特朗普推文内容分析数据集-2024年至今-gpreda 数据来源:互联网公开数据 标签:特朗普,推文,推特,社交媒体,政治,言论分析,自然语言处理,文本数据,美国,总统 数据概述:...
-
比尔盖茨埃隆马斯克和埃德利推特数据集-2017至2023年-micheldc55
2025年4月22日 30 6 4
比尔盖茨埃隆马斯克和埃德利推特数据集-2017至2023年-micheldc55 数据来源:互联网公开数据 标签:推特,比尔盖茨,埃隆马斯克,埃德利,企业家,政治人物,社交媒体,言论分析 数据概述:...
-
特朗普推特档案数据集-2009至2021年-headsortails
2025年4月22日 30 164 163
特朗普推特档案数据集-2009至2021年-headsortails 数据来源:互联网公开数据 标签:特朗普,推特,政治,社会,言论分析,数据集,政治言论,社交网络 数据概述: 本数据集包含了唐纳德·特朗普自2009年以来的所有推文。数据集由网站The Trump...



