中国股市指数及ETF历史交易数据集
数据集概述
本数据集汇集了中国主要股市指数和相关ETF基金的历史交易数据,涵盖2015年至2025年期间的全面市场表现信息。数据集包含上证指数、深证成份指数、MSCI中国净收益指数以及中国概念股ETF(ASHR、FXI)的日度交易数据,为投资分析、市场研究和量化建模提供重要的基础数据资源。
数据规模与结构
数据集总计9个文件,包含23,933条记录,总文件大小2.0MB。数据维度涵盖价格信息(开盘价、收盘价、最高价、最低价)、交易量、涨跌幅以及计算得出的日收益率和累计收益率等关键指标。数据完整性良好,平均完整率达98.4%。
数据内容说明
核心指数数据
- 上证指数历史数据:2021年7月至2025年8月,2,583个交易日数据
- 深证成份指数历史数据:同期2,583个交易日数据
- MSCI中国净收益指数(美元计价):2021年10月至2025年8月,2,739个交易日数据
ETF基金数据
- ASHR ETF数据:2015年1月至2018年12月,2,671个交易日完整数据,ASHR更直接对应中国A股市场
- FXI ETF数据:同期2,671个交易日完整数据,XI更多是中国优质大公司的海外代表
衍生分析数据
- 相关性矩阵:ASHR与FXI之间的相关系数矩阵
- 日价格矩阵:标准化的价格数据结构
- 日收益率矩阵:计算得出的日度收益率数据
字段定义
基础交易字段
- 日期/trade_date:交易日期,格式为YYYY-MM-DD
- 开盘/open:当日开盘价格
- 收盘/close:当日收盘价格
- 高/high:当日最高价格
- 低/low:当日最低价格
- 交易量/volume:当日成交量
- 涨跌幅:当日价格变动百分比
衍生指标字段
- daily_return:日收益率,基于前一交易日收盘价计算
- cumulative_return:累计收益率,基于期初价格计算
- symbol:证券代码标识
- symbol_name:证券完整名称
数据特征
数据涵盖多个时间维度,其中国内指数数据集中在2021-2025年期间,而ETF数据覆盖2015-2018年的较早时期。价格数据以数值型格式存储,确保计算精度。交易量数据单位为股数或交易金额,具体单位因数据源而异。收益率数据采用标准化计算方法,便于跨资产比较分析。
适用场景
本数据集适用于中国股市研究、投资组合分析、风险管理建模、量化交易策略开发、市场相关性研究以及金融教学等多种应用场景。特别适合需要进行中美股市联动分析、ETF与标的指数关系研究以及长期投资策略回测的专业用户。