数据集概述
本数据集为论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》的配套数据,包含98个国家的英语熟练度、政府AI准备度、GDP等数据及分析代码。核心研究英语熟练度(以殖民语言历史为工具变量)与国家AI治理准备度的关系,采用2SLS和GMM-IV方法,所有分析可复现。
文件详解
- 代码文件(.py)
- 文件名称:2sls.py、ai.py、lgdp.py、orig.py
- 文件格式:PY
- 字段映射介绍:2sls.py为主要估计脚本(含2SLS与GMM-IV模型);其余为交互效应分析、变量预处理的支持脚本
- 数据文件(.xlsx)
- 文件名称:EF_EPI_2024_Ranking_with_Puerto_Rico.xlsx、2024-GAIRI-data.xlsx、GDP_2023.xlsx、EEFR_All_States_and_Puerto_Rico.xlsx
- 文件格式:XLSX
- 字段映射介绍:分别对应英语熟练度指数、政府AI准备度指数、2023年GDP数据(含标准化与滞后项)、美国州级数据(未用于全球回归)
- 文档文件(.md)
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:含项目概述、变量定义、方法学说明等详细信息
数据来源
论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》
适用场景
- AI治理能力影响因素分析: 研究英语熟练度对国家AI治理准备度的预测作用
- 法律科技语言基础设施研究: 探索英语作为全球数字治理基础语言的作用机制
- 计量经济学方法应用: 验证2SLS、GMM-IV等工具变量法在跨国家数据分析中的有效性
- 全球政策比较研究: 为不同国家AI治理政策制定提供语言能力维度的参考依据
- 数据可复现性实践: 作为社科研究中代码与数据配套、分析可复现的案例参考