土耳其语恶意言论检测数据集-baalawi1

土耳其语恶意言论检测数据集-baalawi1 数据来源:互联网公开数据 标签:土耳其语,恶意言论,文本分析,自然语言处理,情感分析,机器学习,BERT 数据概述: 本数据集旨在用于训练土耳其语恶意言论检测模型。 数据集包含土耳其语文本,并附带了基于BERT模型提取的特征。 为了方便机器学习实验,避免每次都使用BERT提取特征,我们同时提供了文本数据和BERT特征。 数据来源:Kaggle平台,数据集链接:https://www.kaggle.com/datasets/toygarr/turkish-offensive-language-detection 数据用途概述: 该数据集可用于训练和评估土耳其语恶意言论检测模型,也可用于情感分析、文本分类等自然语言处理任务。研究人员和开发者可以利用该数据进行模型训练、算法优化,探索土耳其语语境下的恶意言论识别方法。此外,该数据集也适用于教育和研究,帮助学习者了解恶意言论检测的技术和应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 182.12 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。