公司高管薪酬讨论与分析文本数据集_Executive_Compensation_Discussion_and_Analysis_Text_Dataset
数据来源:互联网公开数据
标签:高管薪酬, 文本分析, 公司治理, 财务报告, 自然语言处理, 文本挖掘, 机器学习, 薪酬制度
数据概述:
该数据集包含来自美国证券交易委员会(SEC)披露的公司高管薪酬讨论与分析(CD&A)文本数据,记录了不同年份上市公司关于高管薪酬方案的详细讨论与分析。主要特征如下:
时间跨度:数据涵盖2007年至2021年,提供了长达15年的时间序列数据。
地理范围:数据主要来源于美国上市公司,反映了美国企业高管薪酬的实践情况。
数据维度:数据集包括cik(公司中心索引编号)、file(SEC文件编号)、ann_year(公告年份)、fyear(财年)、datadate(数据日期)、gvkey(Global Company Key,全球公司关键标识符)和cda_text(CD&A文本)等字段。
数据格式:数据以CSV格式存储,每个CSV文件对应一个财年的数据,便于进行数据分析和处理。
来源信息:数据来源于SEC的公开披露文件,经过提取和整理,提供了结构化的CD&A文本数据。
该数据集适合用于公司治理、财务报告分析和自然语言处理相关的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于公司治理、高管薪酬、财务报告等领域的学术研究,例如分析高管薪酬与公司业绩的关系,以及研究薪酬披露文本的情感分析。
行业应用:可以为金融行业、咨询公司等提供数据支持,特别是在风险评估、投资决策、薪酬咨询等方面。
决策支持:支持企业优化高管薪酬方案,改进公司治理结构,提高信息披露质量。
教育和培训:作为公司治理、财务分析、文本挖掘等课程的辅助材料,帮助学生和研究人员深入理解高管薪酬制度。
此数据集特别适合用于探索高管薪酬与公司业绩、公司治理水平之间的关系,以及分析高管薪酬披露文本的语言特征,帮助用户实现深入的财务分析和风险评估。