数据集概述
本数据集用于四种德语增强写作技术检测性别排斥的实证分析,包含约16万条来自三个平台的招聘广告数据,记录了各工具提取的表达式数量、性别得分及类别等信息,辅以变量说明和关键词列表,为相关研究提供支持。
文件详解
- 数据文件
- 文件名称:PONE-D-21-23428_minimal_data_set.csv
- 文件格式:CSV
- 字段映射:包含数据源(datasource)、职位描述词数(job_description_wordcount)、类别名称(category_name)、领导岗位标识(lead_FEA)、领导岗位名称(lead_title)、性别得分(fmint_gender_score)、女性/男性词汇数量及唯一词汇数量(fmint_f_words_count等)、检测结果(fmint_result)等字段
- 文件名称:PONE-D-21-23428_minimal_data_set_eng.csv
- 文件格式:CSV
- 字段映射:与上述CSV文件字段一致,为英文表头版本
- 说明文件
- 文件名称:Minimal data set_description.xlsx
- 文件格式:XLSX
- 内容说明:数据集变量描述文档
- 关键词文件
- 文件名称:Lead_keywords.txt
- 文件格式:TXT
- 内容说明:包含德语领导岗位关键词,如Leit、Abteilungsleit等
适用场景
- 招聘广告性别包容性分析: 评估增强写作工具对德语招聘广告中性别排斥表达的检测效果
- 文本分析工具性能对比: 比较不同增强写作技术在性别得分计算、词汇提取等方面的表现差异
- 人力资源公平性研究: 分析招聘广告中性别相关语言特征与岗位类别的关联
- 自然语言处理应用: 用于招聘文本性别排斥检测模型的训练与验证