GermEval18文本分类数据集-thedevastator

GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述: GermEval18是一个文本分类数据集,包含用于二元和多类分类任务的文本数据。数据集分为train.csv和test.csv两个文件。train.csv包含大量带标签的文本数据,包括文本内容、二元分类标签和多类分类标签。test.csv包含额外的示例,用于评估在train.csv上训练的模型。

数据用途概述: 该数据集主要用于文本分类任务,可应用于情感分析、主题分类、垃圾邮件检测等多个场景。研究人员可以利用该数据集训练和评估各种文本分类模型,例如朴素贝叶斯、逻辑回归、支持向量机等。具体应用包括:分析客户评论的情感倾向,将文本数据分类到不同的主题或类别,以及识别垃圾邮件等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 63.5 MiB
最后更新 2025年4月26日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。