2021年网络热门股票异常预测数据集-palealex
数据来源:互联网公开数据
标签:网络热门股票,股票预测,异常检测,金融数据,投资分析,时间序列,数据预处理
数据概述:
本数据集包含2021年被认为是网络热门股票(如GME = Gamestop)的18只股票的历史信息。训练集包含16只股票的数据,测试集包含2只股票的数据。所有用于分析的特征已通过Sklearn的MinMax Scaler进行适当缩放(目标列除外)。每行数据基于10天滚动窗口的聚合计算。
数据集定义了两个目标标签:"target_return"(目标收益率)和"target_volatility"(目标波动率),均包含在数据集中。您可以选择其中一个或两者进行分析。分析目标是预测潜在网络热门股票在未来10天内的价格异常。当未来10天内出现异常时,目标标签值为1。由于目标列直接基于股票价格计算,因此不应使用"AdjClose"或"AdjClose_delta"进行分析。
目标标签计算公式如下(lag = 10, rend = 0.5, volatility = 0.1):
df["target_return"] = np.where(np.exp(df['AdjClose_delta'].rolling(lag).sum().shift(-lag+1))-1>=rend, 1, 0)
df["target_volatility"] = np.where(df['AdjClose_delta'].rolling(lag).std().shift(-lag+1)>= volatility, 1, 0)
数据用途概述:
该数据集适用于股票价格异常预测、网络热门股票分析、金融数据建模、投资策略研究等场景。研究人员可以利用此数据集进行模型训练和验证,以预测股票价格的异常波动;投资者可以利用预测结果调整投资组合;金融分析员可以利用数据进行市场趋势分析,帮助制定投资策略。数据集还适合用于教育和培训,帮助学习者理解股票市场的动态变化和风险评估方法。