Undoing_Babel_Based_全球法律AI语言基础设施研究数据

数据集概述

本数据集为论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》的配套数据,包含98个国家的英语熟练度、政府AI准备度、GDP等数据及分析代码。核心研究英语熟练度(以殖民语言历史为工具变量)与国家AI治理准备度的关系,采用2SLS和GMM-IV方法,所有分析可复现。

文件详解

  • 代码文件(.py)
  • 文件名称:2sls.py、ai.py、lgdp.py、orig.py
  • 文件格式:PY
  • 字段映射介绍:2sls.py为主要估计脚本(含2SLS与GMM-IV模型);其余为交互效应分析、变量预处理的支持脚本
  • 数据文件(.xlsx)
  • 文件名称:EF_EPI_2024_Ranking_with_Puerto_Rico.xlsx、2024-GAIRI-data.xlsx、GDP_2023.xlsx、EEFR_All_States_and_Puerto_Rico.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:分别对应英语熟练度指数、政府AI准备度指数、2023年GDP数据(含标准化与滞后项)、美国州级数据(未用于全球回归)
  • 文档文件(.md)
  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:含项目概述、变量定义、方法学说明等详细信息

数据来源

论文《Undoing Babel: AI, English, and the New Linguistic Infrastructure of Global Law》

适用场景

  • AI治理能力影响因素分析: 研究英语熟练度对国家AI治理准备度的预测作用
  • 法律科技语言基础设施研究: 探索英语作为全球数字治理基础语言的作用机制
  • 计量经济学方法应用: 验证2SLS、GMM-IV等工具变量法在跨国家数据分析中的有效性
  • 全球政策比较研究: 为不同国家AI治理政策制定提供语言能力维度的参考依据
  • 数据可复现性实践: 作为社科研究中代码与数据配套、分析可复现的案例参考
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.14 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。