数据集概述
本数据集是一份由CSET研究人员人工编制的关于全球先进逻辑芯片生产供应链的综合数据库。数据集系统性地汇总了与芯片制造相关的工具、材料、工艺、设计软件以及关键参与国家与企业的信息。数据主要反映了截至2025年中期,基于行业数据(如TechInsights)和公开分析资料的研究成果,时间范围覆盖2019年至2024年的核心数据。其旨在为研究人员和决策者提供一幅全球先进半导体供应链的全景图,以支持供应链结构和国家角色的深入分析。
数据内容
该数据集由五个核心的关联数据表构成,共同描绘了半导体供应链的完整结构。inputs表定义了生产所需的输入项,包括材料、设备、工艺和设计等。providers表记录了全球范围内的供应者信息,涵盖国家和企业两个维度。provision表是关键的关联表,详细记录了每个供应者在特定输入项中所占的市场份额。sequence表揭示了各输入项之间的关系,包括生产流程中的前后依赖关系和层级分类关系。stages表则对整个生产流程进行了阶段划分,如光刻、沉积、测试与封装等。
字段定义
数据集包含以下核心字段类别:
- 输入项表 (inputs):
input_id: 输入项的唯一标识符
input_name: 输入项名称(如材料、设备、工艺)
type: 输入项类型
stage_id: 所属生产阶段的标识符
description: 输入项的详细描述
- 供应者表 (providers):
provider_id: 供应者的唯一标识符
provider_name: 供应者名称(国家或公司)
provider_type: 供应者类型(国家或公司)
country: 供应者所属国家(以总部所在地为准)
- 供应关系表 (provision):
provider_id: 供应者的标识符
provided_id: 被提供的输入项标识符
share_provided: 市场份额(百分比)
year: 数据年份
source: 数据来源
- 流程关系表 (sequence):
input_id: 当前输入项的标识符
goes_into_id: 下一流程环节的输入项标识符(表示依赖关系)
is_type_of_id: 所属类别的输入项标识符(表示层级关系)
- 生产阶段表 (stages):
stage_id: 生产阶段的唯一标识符
stage_name: 生产阶段名称(如光刻、封装)
description: 阶段的详细描述
数据特征
该数据集结构设计精良,通过五个相互关联的表格,全面地描绘了从设计到成品的整个半导体供应链网络。其核心优势在于通过sequence表清晰地揭示了产业链中各环节的依赖关系与层级结构,为深入的结构性分析提供了可能。数据包含了基于权威行业报告计算的国家与企业级市场份额,为评估各环节的市场集中度和识别潜在的供应链瓶颈(“卡点”)提供了直接量化依据。作为由专业研究机构人工整理和验证的数据,其在行业分类的准确性和信息的可靠性方面具有显著优势,特别适合用于宏观战略与政策层面的研究。
适用场景
本数据集适用于以下分析与应用场景:
- 供应链结构分析:系统了解先进芯片的生产体系、关键流程、设备及材料
- 国家与企业角色评估:分析特定国家或企业在全球半导体产业链中的地位与依赖程度
- 供应链瓶颈识别:通过市场份额数据分析产业链中由少数实体控制的“卡点”环节
- 依赖关系探索:研究生产流程中不同工艺、材料和设备之间的相互依赖关系
- 产业竞争力研究:评估不同国家在半导体供应链各环节的竞争优势
- 可视化分析与教学:结合可视化工具,直观展示复杂的供应链网络结构
数据来源
本数据集由CSET研究人员整合多个权威来源的数据编制而成,主要数据来源包括:TechInsights半导体设备数据库(CMRS)、世界半导体贸易统计组织(WSTS)、美国半导体产业协会(SIA)以及CSET内部研究报告。市场份额数据主要基于CMRS提供的公司级营收数据计算得出,并按公司总部所在地进行国家归属划分。