文本分类广告数据集-2023-overflow012

文本分类广告数据集-2023-overflow012 数据来源:互联网公开数据 标签:广告分类,文本分析,机器学习,工作招聘,房地产,广告预测,数据处理,分类模型

数据概述: 本数据集包含用于广告文本分类的样本数据,数据集中每个广告文本均未提供类别和子类别信息,需要自动进行分类。数据集包含以下字段:

catid:广告的类别,可能的取值包括: - 2 = 工作招聘 - 3 = 房地产

subcatid:广告的子类别,可能的取值包括: - 2 = 出售公寓/房屋 - 11 = 律师 - 12 = 行政/秘书 - 14 = 呼叫中心 - 15 = 建筑 - 16 = 会计/财务 - 17 = 教育/教师 - 19 = 客户支持 - 20 = 酒吧/餐厅 - 21 = 生物技术 - 22 = 零售 - 23 = 技术支持 - 24 = 远程工作 - 26 = 运输 - 27 = 医疗/健康 - 28 = 时尚 - 29 = 广告/营销 - 30 = 人力资源 - 31 = 公关 - 32 = 出售者 - 33 = 工程师/建筑师 - 34 = 软件 - 35 = 批发 - 51 = 租赁公寓/房屋 - 122 = 其他广告 - 132 = 旅行/旅游 - 134 = 行政/高管

数据用途概述: 该数据集适用于多种应用场景,包括自动广告分类、重复广告检测、广告类型预测等。研究者可以使用该数据集训练分类模型,以实现自动广告分类功能;广告平台可以利用该数据集提高广告的分类准确性,减少人工干预;教育机构可以使用该数据集进行机器学习课程的教学和实践。此外,数据集还可以用于广告市场分析、消费者行为研究等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 51.89 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。