数据集

Undoing_Babel_Based_全球法律AI语言基础设施研究数据

数据集概述

本数据集为论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》的配套数据，包含98个国家的英语熟练度、政府AI准备度、GDP等数据及分析代码。核心研究英语熟练度（以殖民语言历史为工具变量）与国家AI治理准备度的关系，采用2SLS和GMM-IV方法，所有分析可复现。

文件详解

代码文件（.py）
文件名称：2sls.py、ai.py、lgdp.py、orig.py
文件格式：PY
字段映射介绍：2sls.py为主要估计脚本（含2SLS与GMM-IV模型）；其余为交互效应分析、变量预处理的支持脚本
数据文件（.xlsx）
文件名称：EF_EPI_2024_Ranking_with_Puerto_Rico.xlsx、2024-GAIRI-data.xlsx、GDP_2023.xlsx、EEFR_All_States_and_Puerto_Rico.xlsx
文件格式：XLSX
字段映射介绍：分别对应英语熟练度指数、政府AI准备度指数、2023年GDP数据（含标准化与滞后项）、美国州级数据（未用于全球回归）
文档文件（.md）
文件名称：README.md
文件格式：MD
字段映射介绍：含项目概述、变量定义、方法学说明等详细信息

数据来源

论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》

适用场景

AI治理能力影响因素分析: 研究英语熟练度对国家AI治理准备度的预测作用
法律科技语言基础设施研究: 探索英语作为全球数字治理基础语言的作用机制
计量经济学方法应用: 验证2SLS、GMM-IV等工具变量法在跨国家数据分析中的有效性
全球政策比较研究: 为不同国家AI治理政策制定提供语言能力维度的参考依据
数据可复现性实践: 作为社科研究中代码与数据配套、分析可复现的案例参考

数据与资源

15635672.zipZIP
0.14 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.14 MiB
最后更新	2026年1月22日
创建于	2026年1月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。