虚假招聘信息检测数据集

虚假招聘信息检测数据集 数据来源:互联网公开数据
标签:招聘信息,虚假信息检测,机器学习,数据不平衡,缺失值处理,分类模型,集成学习,行业合规

数据概述
本数据集用于区分真实的招聘信息和虚假的招聘信息,旨在帮助识别网络上潜在的欺诈行为。数据集包含数万个招聘信息样本,涵盖了在线招聘平台上的职位描述、公司信息、职位要求等关键字段。数据具有显著的类别不平衡问题,即虚假招聘信息样本数量远少于真实招聘信息样本,同时数据中存在部分缺失字段,这对模型训练提出了较高的挑战。 数据字段包括但不限于:
- 职位名称:描述岗位的具体名称。
- 公司名称:招聘公司的名称。
- 岗位要求:对求职者技能、经验的要求。
- 公司行业:公司所属的行业类别。
- 薪资范围:职位提供的薪资信息。
- 职位描述:详细的岗位职责描述。
- 标签:标明该招聘信息为真实或虚假(0代表真实,1代表虚假)。

数据用途概述
该数据集适用于以下场景:
1. 虚假信息检测:帮助招聘平台和求职者识别虚假招聘信息,保护求职者的权益,减少欺诈风险。
2. 机器学习研究:提供一个具有挑战性的数据集,用于研究数据不平衡和缺失值处理等问题,尤其是在集成学习和分类模型的优化方面。
3. 行业合规:支持相关机构制定更有效的监管政策,确保招聘市场的透明度和安全性。
4. 教育与培训:可用于教学和研究,帮助学生和研究人员了解虚假信息检测的原理和技术实现。

通过该数据集,研究人员和从业者可以开发更高效的算法,提升虚假招聘信息的检测准确率,从而为招聘市场提供更安全的环境。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 15.86 MiB
最后更新 2025年4月19日
创建于 2025年4月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。