Gender_Exclusion_Detection_德语招聘广告增强写作工具性能评估数据集

数据集概述

本数据集用于四种德语增强写作技术检测性别排斥的实证分析,包含约16万条来自三个平台的招聘广告数据,记录了各工具提取的表达式数量、性别得分及类别等信息,辅以变量说明和关键词列表,为相关研究提供支持。

文件详解

  • 数据文件
  • 文件名称:PONE-D-21-23428_minimal_data_set.csv
  • 文件格式:CSV
  • 字段映射:包含数据源(datasource)、职位描述词数(job_description_wordcount)、类别名称(category_name)、领导岗位标识(lead_FEA)、领导岗位名称(lead_title)、性别得分(fmint_gender_score)、女性/男性词汇数量及唯一词汇数量(fmint_f_words_count等)、检测结果(fmint_result)等字段
  • 文件名称:PONE-D-21-23428_minimal_data_set_eng.csv
  • 文件格式:CSV
  • 字段映射:与上述CSV文件字段一致,为英文表头版本
  • 说明文件
  • 文件名称:Minimal data set_description.xlsx
  • 文件格式:XLSX
  • 内容说明:数据集变量描述文档
  • 关键词文件
  • 文件名称:Lead_keywords.txt
  • 文件格式:TXT
  • 内容说明:包含德语领导岗位关键词,如Leit、Abteilungsleit等

适用场景

  • 招聘广告性别包容性分析: 评估增强写作工具对德语招聘广告中性别排斥表达的检测效果
  • 文本分析工具性能对比: 比较不同增强写作技术在性别得分计算、词汇提取等方面的表现差异
  • 人力资源公平性研究: 分析招聘广告中性别相关语言特征与岗位类别的关联
  • 自然语言处理应用: 用于招聘文本性别排斥检测模型的训练与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 114.93 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。