Jigsaw多语言评论训练数据集-2021-miklgr500

Jigsaw多语言评论训练数据集-2021-miklgr500 数据来源:互联网公开数据 标签:Jigsaw,多语言,评论,分类,机器学习,Google API,翻译,训练数据

数据概述: 本数据集是“Jigsaw多语言毒评论分类”竞赛的翻译训练数据集,使用了Google API的翻译库进行翻译。该数据集包含十二个文件,涵盖了葡萄牙语、土耳其语、俄语、意大利语、西班牙语和法语六种语言的翻译评论。数据集旨在为多语言评论的分类任务提供训练数据支持,帮助模型识别和分类不同语言中的有毒评论。

数据用途概述: 该数据集适用于自然语言处理、机器学习和评论分类等研究领域。研究人员可以利用此数据集训练和评估多语言文本分类模型;开发者可以将其用于开发多语言评论过滤系统;教育机构可以将其作为教学资源,培养学生在多语言环境下的文本分析能力。该数据集对于促进跨语言的毒评论识别具有重要的应用价值。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 487.57 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。