佛蒙特大学UVM教职工薪资概览数据集-2009-2021-tysonpo
数据来源:互联网公开数据
标签:薪资,大学,教职工,佛蒙特大学,UVM,时间序列,教育,人力资源,薪酬,分析
数据概述:
本数据集包含2009年至2021年佛蒙特大学(UVM)教职工的薪资信息,旨在为研究UVM教职工薪酬状况提供数据支持。数据集分为两个版本:
salaries_without_dept.csv:该数据集包含了从PDF文档中提取的所有数据,共47,479行,包含以下四个字段:年份(Year)、教职工姓名(Faculty Name)、主要职位(Primary Job Title)和基本工资(Base Pay)。
salaries_final.csv:该数据集在salaries_without_dept.csv的基础上,增加了教职工的院系信息(Department)和学院信息(College),总共包含六个字段,共14,470行。由于数据合并时需要匹配教职工的院系信息,因此该数据集的行数少于前者。
数据收集方法:
数据来源于佛蒙特大学官方网站公开的PDF文档,通过Python的Camelot库解析表格数据,并使用正则表达式进行数据清洗。为了获取教职工的院系和学院信息,使用网络爬虫技术从http://catalogue.uvm.edu/undergraduate/faculty/fulltime获取数据,并手动构建了院系到学院的映射关系。需要注意的是,该网站提供的教职工信息主要针对2020年,因此数据集主要反映了截至2020年仍在职的教职工信息。此外,由于数据来源的限制,该数据集可能不包含所有UVM教职工,如部分行政人员等。
数据用途概述:
该数据集可用于多种数据分析和探索性数据分析(EDA)场景,例如:
薪资趋势分析:分析不同年份、不同职位教职工的薪资变化。
院系薪资比较:比较不同院系教职工的平均薪资水平。
学院薪资比较:比较不同学院教职工的平均薪资水平。
职位晋升分析:研究教职工晋升的时间和薪资变化。
此外,该数据集还可以与其他UVM数据结合使用,或者与其他大学的数据集进行比较分析。
数据字典:
为了更好地理解“College”字段的含义,数据集还提供了data_dictionary.csv文件,其中包含了“College”字段的缩写含义。用户可以使用该字典筛选出特定学院的数据,例如,排除UVM图书馆等非本科生院系。