上市公司高管薪酬讨论与分析文本数据集_Executive_Compensation_Discussion_and_Analysis_Text_Dataset
数据来源:互联网公开数据
标签:高管薪酬, 文本分析, 公司治理, 财务报告, 自然语言处理, 文本挖掘, 监管文件, SEC文件
数据概述:
该数据集包含来自美国证券交易委员会(SEC)公开披露的上市公司高管薪酬讨论与分析(CD&A)文本数据。主要特征如下:
时间跨度:数据覆盖2006年至2021年,涵盖了十余年的时间跨度,为研究长期趋势提供了基础。
地理范围:数据主要来源于在美国上市的公司,反映了美国市场上的公司治理和高管薪酬实践。
数据维度:数据集的核心是CD&A文本,同时包含公司识别码(CIK)、文件编号、公告年份、财务年度、数据日期、公司标识符(GVKEY)等元数据。部分文件还包含分析结果,例如“analysis_result”。
数据格式:数据以CSV格式提供,便于数据分析和处理。每个CSV文件对应特定年份的CD&A文本。
来源信息:数据来源于上市公司提交给SEC的10-K和10-Q等报告中的CD&A部分。数据已进行结构化处理,方便进行文本分析。
该数据集适合用于公司治理研究、高管薪酬分析、文本挖掘和自然语言处理等领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于公司治理、高管薪酬、财务报告等领域的学术研究,如分析高管薪酬与公司业绩的关系、评估CD&A文本对投资者决策的影响等。
行业应用:可以为金融行业、咨询公司和投资者提供数据支持,用于风险评估、投资决策和公司治理评估。
决策支持:支持公司在制定高管薪酬方案时进行基准分析,优化薪酬结构,提升公司治理水平。
教育和培训:作为金融、会计、公司治理等相关课程的辅助材料,帮助学生和研究人员深入理解高管薪酬的构成、披露和影响。
此数据集特别适合用于探索高管薪酬披露的语言特征与公司绩效之间的关系,以及评估CD&A文本在信息披露中的作用,帮助用户实现对公司治理和高管薪酬更深入的理解和分析。