职位技能集数据集
数据来源:互联网公开数据
标签:职位技能,招聘,技能提取,自然语言处理,职位匹配,推荐系统,行业分析
数据概述:
职位技能集数据集旨在用于与职位匹配、技能提取和自然语言处理相关的机器学习项目。数据集包含了职位角色、描述及其相关技能集的详细信息,使开发者和研究者能够构建和评估职业生涯推荐系统、简历解析和技能推断的模型。
数据集最初来源于Kaggle数据集《LinkedIn职位发布》(作者为Arshkon),原始职位发布数据通过RecAI API服务进一步增强,提取了技能集。这些API专门用于技能解析、简历分析和其他招聘相关任务。
数据集包含以下特征:
job_id:每个职位发布的唯一标识符。
category:职位类别,如信息技术、业务发展、财务、销售或人力资源。
job_title:职位名称。
job_description:职位的详细文本描述,包括职责和资格要求。
job_skill_set:使用RecAI API提取的相关技能列表(包括硬技能和软技能)。
数据用途概述:
该数据集特别适用于以下应用场景:
技能提取:从职位描述中识别和解析技能。
职位-简历匹配:将职位描述与潜在候选者档案进行匹配。
推荐系统:开发基于所需技能的职位或培训项目推荐模型。
自然语言处理:在招聘和职业分析中实验基于文本的模型。
引用
如果您使用此数据集,请按以下格式引用:
@misc{batuhan_mutlu_2024,
title={职位技能集},
url={https://www.kaggle.com/dsv/10201355},
DOI={10.34740/KAGGLE/DSV/10201355},
publisher={Kaggle},
author={Batuhan Mutlu},
year={2024}
}