TalentCLEF2025人力资本管理技能与职位智能语料库

数据集概述

本数据集为TalentCLEF2025竞赛语料库,包含多语言职位匹配(任务A)与职位技能预测(任务B)的训练、验证及测试数据,用于开发人力资本管理相关模型,支持人才匹配、技能发展与技能缺口检测等应用。

文件详解

数据集包含4个ZIP压缩文件,具体说明如下: - 压缩文件: - TaskA.zip: 包含任务A(多语言职位匹配)数据,按训练、验证、测试阶段及语言(英、西、德、中)划分目录,含TSV格式训练文件及验证/测试用的queries、corpus_elements、qrels文件。 - TaskB.zip: 包含任务B(职位技能预测)数据,按训练、验证、测试阶段划分目录,含job2skill.tsv等训练文件及验证/测试用的queries、corpus_elements、qrels文件。 - sampleset_TaskA.zip: 任务A的样本数据集压缩文件。 - sampleset_TaskB.zip: 任务B的样本数据集压缩文件。

适用场景

  • 人力资本管理研究: 开发职位匹配、技能预测模型,支持人才招聘与技能发展策略。
  • 多语言NLP应用: 研究多语言职位标题匹配的算法性能与跨语言适配。
  • 技能缺口分析: 基于职位数据检测组织内的新兴技能与技能缺口。
  • 竞赛模型开发: 为TalentCLEF2025竞赛参与者提供训练与测试数据,用于模型开发与评估。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.43 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。