Jigsaw竞赛英语翻译文本数据集

Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识

数据概述: 本数据集包含Jigsaw竞赛中,将文本翻译成英语的数据。数据集的核心字段是“content_en”,其中包含了翻译后的英语文本。部分文本在翻译过程中因内容不当(如包含不适合的语言或仅为数字字符串等)而出现错误,这些错误会被标记为“pass”。

数据用途概述: 该数据集可用于构建辅助模型,用于训练或优化文本翻译系统。研究人员可以利用该数据集进行文本翻译质量评估、错误检测、以及改进翻译模型的鲁棒性。此外,该数据集也适用于自然语言处理相关的研究,例如负面评论分析、情感分析等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 249.57 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。