数据集

垃圾文本分类数据集

垃圾文本分类数据集数据来源：互联网公开数据
标签：垃圾文本,文本分类,自然语言处理,市场调研,质量控制,机器学习

数据概述：
本数据集包含两个部分：gibberish数据集和Amazon数据集。gibberish数据集由低质量调查回复整理而成，用于识别垃圾文本。数据集包含“Response”（调查回复）和“Label”（标签）两个字段，其中标签为0表示垃圾文本。Amazon数据集来自数百万条亚马逊文本评论和评分，包含“Review Label”（评论标签）和“Review Text”（评论文本）两个字段。该数据集经过整理和格式转换，以CSV格式提供，便于数据处理和分析。

数据用途概述：
该数据集适用于垃圾文本检测、自然语言处理模型训练、市场调研质量控制等多种场景。研究人员可利用此数据集训练分类模型，识别低质量文本；企业可将其应用于质量控制流程，提高数据准确性；同时，数据集也适用于教育培训，帮助学习者掌握垃圾文本检测和自然语言处理的基本方法。

数据与资源

垃圾文本分类数据集.zipZIP
169.06 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	169.06 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

垃圾文本分类数据集

数据与资源

附加信息

注册成功！