数据集

烟草广告文本分类数据集TobaccoAdvertisementTextClassification-haytemcharraj

数据来源：互联网公开数据

标签：文本分类, 烟草广告, 负面宣传, 机器学习, 舆情分析, 广告文本, 公共卫生, 政策研究

数据概述：该数据集包含从烟草广告中提取的文本信息，记录了广告内容及其对应的分类标签。主要特征如下：时间跨度：数据未标明具体时间，可视为历史广告文本的集合。地理范围：数据来源未明确，但文本内容涉及美国等地的烟草广告，可能具有一定的地域代表性。数据维度：包括“words”（广告文本内容）和“class”（分类标签，具体含义未明确，推测可能代表广告的不同类型或主题）两个字段。数据格式：CSV格式，文件名为train.csv，方便进行文本分析和模型训练。来源信息：数据来源未明确，但其内容涉及烟草广告，可能来自于政府报告、行业研究或公开的广告档案等。该数据集适合用于探索烟草广告的文本特征、分类、以及与公共卫生相关的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于公共卫生、广告学、以及自然语言处理等领域的学术研究，如烟草广告的负面宣传分析、广告文本的情感分析、以及广告效果评估研究等。行业应用：可以为广告行业提供数据支持，特别是在广告内容审查、品牌声誉管理、以及市场营销策略优化等方面。决策支持：支持政府部门制定烟草控制政策，评估广告对公众健康的影响，以及指导相关法规的制定。教育和培训：作为文本分类、机器学习等课程的实训数据，帮助学生和研究人员理解文本分类任务，并学习如何处理和分析广告文本数据。此数据集特别适合用于研究烟草广告的语言特征，评估广告内容对公众健康的影响，以及探索有效的烟草控制策略。

数据与资源

versions_20250404063210.zipZIP
12.04 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	12.04 MiB
最后更新	2025年5月29日
创建于	2025年5月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

烟草广告文本分类数据集TobaccoAdvertisementTextClassification-haytemcharraj

数据与资源

附加信息

注册成功！