文本分类广告数据集-2023-overflow012
数据来源:互联网公开数据
标签:广告分类,文本分析,机器学习,工作招聘,房地产,广告预测,数据处理,分类模型
数据概述:
本数据集包含用于广告文本分类的样本数据,数据集中每个广告文本均未提供类别和子类别信息,需要自动进行分类。数据集包含以下字段:
catid:广告的类别,可能的取值包括:
- 2 = 工作招聘
- 3 = 房地产
subcatid:广告的子类别,可能的取值包括:
- 2 = 出售公寓/房屋
- 11 = 律师
- 12 = 行政/秘书
- 14 = 呼叫中心
- 15 = 建筑
- 16 = 会计/财务
- 17 = 教育/教师
- 19 = 客户支持
- 20 = 酒吧/餐厅
- 21 = 生物技术
- 22 = 零售
- 23 = 技术支持
- 24 = 远程工作
- 26 = 运输
- 27 = 医疗/健康
- 28 = 时尚
- 29 = 广告/营销
- 30 = 人力资源
- 31 = 公关
- 32 = 出售者
- 33 = 工程师/建筑师
- 34 = 软件
- 35 = 批发
- 51 = 租赁公寓/房屋
- 122 = 其他广告
- 132 = 旅行/旅游
- 134 = 行政/高管
数据用途概述:
该数据集适用于多种应用场景,包括自动广告分类、重复广告检测、广告类型预测等。研究者可以使用该数据集训练分类模型,以实现自动广告分类功能;广告平台可以利用该数据集提高广告的分类准确性,减少人工干预;教育机构可以使用该数据集进行机器学习课程的教学和实践。此外,数据集还可以用于广告市场分析、消费者行为研究等。