数据集概述
本数据集详细记录了全球199个国家和地区的护照持有者前往其他国家或地区时的签证要求。数据涵盖了2019年至2025年间的签证政策信息,共包含约39,601条国家间的签证关系记录。数据集提供了多种格式,包括便于分析的Tidy长格式和便于查阅的矩阵宽格式,并同时使用国家全称、ISO 3166-1 alpha-2(两位字母)和alpha-3(三位字母)代码作为标识符,以适应不同应用场景。
数据内容
数据集由六个核心文件组成,全面覆盖了199个护照签发国家/地区与199个目的地国家/地区之间的签证政策。数据分为两种结构:
- Tidy长格式(3个文件): 每个文件包含39,601条记录,设有“护照签发国”、“目的地”和“签证要求”三个字段,分别使用国家全称、ISO2代码和ISO3代码进行标识。
- 矩阵宽格式(3个文件): 每个文件包含199行和200列,其中行代表护照签发国,列代表目的地国。单元格内的值为对应的签证要求。
签证要求字段(Requirement)包含23种不同的类别,其中“需要签证”占比最高(约32.6%),其次为“90天免签”(约19.3%)、“电子签证”(约19.0%)和“落地签”(约15.3%)。数据集整体数据完整性极高,核心字段无缺失值。
字段定义
数据集根据文件格式不同,包含以下核心字段类别:
数据特征
该数据集结构设计优良,为不同类型的分析提供了极大便利。数据以两种主流格式提供,即适合关系型数据库和统计软件处理的Tidy长格式,以及适合快速查阅和网络分析的矩阵宽格式,满足了从数据存储到复杂模型构建的 diverse 需求。数据覆盖范围广泛,包含了全球199个国家和地区,构成了一个完整的全球流动性关系网络。同时,数据集提供了国家全称、ISO2和ISO3三种标准化代码,极大地简化了与其他地理、经济或社会数据集的融合对接工作。数据质量非常高,核心信息完整无缺,几乎没有缺失值,为分析结果的准确性和可靠性提供了坚实基础。
适用场景
本数据集适用于以下分析与应用场景:
- 护照指数与全球流动性排名: 计算和比较各国护照的“实力”或免签得分。
- 国际关系与地缘政治分析: 研究国家间的双边关系、联盟状态和外交政策影响力。
- 旅游业市场潜力分析: 识别签证政策宽松、具有增长潜力的客源市场和旅游目的地。
- 网络分析与可视化: 构建全球人员流动网络图,分析国家节点的中心度和社群结构。
- 移民政策与人口流动研究: 分析全球人口流动的政策壁垒与便利性。
- 数据科学教学与实践: 作为图论、网络分析和数据清洗整理的理想教学案例。
- 跨国商务与个人出行规划: 为企业和个人提供跨国出行签证政策的快速参考。
数据来源
本数据集基于公开的全球护照指数信息(如Passport Index网站)整理而成。