Optiver股票交易市场数据处理与聚合数据集-预测波动率竞赛
数据来源:互联网公开数据
标签:股票交易,市场数据,波动率预测,金融,量化交易,数据聚合,特征工程,Optiver竞赛
数据概述:
本数据集是针对Optiver真实波动率预测竞赛所提供原始数据的处理版本,旨在将原始的股票买卖盘数据(book data)和交易数据(trade data)整合、汇总,形成一个便于建模分析的单一数据集。该数据集基于竞赛原始数据,通过一系列的计算和聚合,提取了关键的统计特征。
数据内容:
该数据集通过如下代码处理和聚合了原始数据,主要关注均值和标准差:
- row_id: 唯一标识符,由股票ID和时间ID组合而成
- wap_mean: 加权平均价格的均值
- wap_std: 加权平均价格的标准差
- log_return_mean: 对数收益率的均值
- log_return_std: 对数收益率的标准差
- ask_size_mean: 卖方最优报价量的均值
- ask_size_std: 卖方最优报价量的标准差
- ask_price_mean: 卖方最优报价价格的均值
- ask_price_std: 卖方最优报价价格的标准差
- bid_size_mean: 买方最优报价量的均值
- bid_size_std: 买方最优报价量的标准差
- bid_price_mean: 买方最优报价价格的均值
- bid_price_std: 买方最优报价价格的标准差
- actual_price_mean: 实际交易价格的均值
- actual_price_std: 实际交易价格的标准差
- size_mean: 交易量的均值
- size_std: 交易量的标准差
- order_count_mean: 交易订单数量的均值
- order_count_std: 交易订单数量的标准差
数据用途概述:
该数据集主要用于波动率预测模型的构建与评估。 适用于金融领域量化交易策略的开发、市场微观结构研究、高频交易策略的模拟等。 参与者可以利用该数据集进行特征工程、模型训练和性能测试,从而在Optiver真实波动率预测竞赛中进行竞争。此外,该数据集也为金融领域的数据分析师和研究人员提供了宝贵的实践素材。