美国股市交易数据集-2021至2023年-mohammedobeidat
数据来源:互联网公开数据
标签:股票市场,金融数据,技术指标,基本面分析,预测模型,交易策略,市场研究
数据概述:
本数据集包含了用于训练和测试的文件,并已按照相应标准进行拆分。数据集包含两组特征,可用于预测:
- 基本面与比率:从每个股票代码的财务报告和资产负债表中收集的数据值。
- 技术指标与交易策略标志:基于每日收盘价计算的技术指标以及使用常用交易策略生成的买卖信号。
基本面上的数据文件位于Fundamentals文件夹中,是原始文件夹中数据的处理版本。比率和其他值已拉伸以匹配收盘价列的长度,例如pe_ratio列中的值是最近季度的市盈率(PE比率),这一规则适用于所有列。技术指标使用Pandas_TA包中的默认参数进行计算。
数据来源于finance.yahoo.com和macrotrends.net。由于某些股票在不同时间框架内可能在这些网站上不可用,因此给定数据的时间范围对每个股票代码可能不同。
所有用于收集数据、执行预处理和特征工程以获取数据的代码可以在以下Kaggle笔记本中找到:
文件
- {_ticker_train}.csv - 训练集
- {_ticker_test}.csv - 测试集
列名假设您熟悉股票市场而具有自解释性。您可能会遇到以下缩写:
- tmm:Trailing Twelve Months(过去12个月)
- pe:Price to Earnings(市盈率)
- pb:Price to Book Value(市净率)
- ps:Price to Sales(市销率)
- fcf:Free Cash Flow(自由现金流)
- eps:Earnings per Share(每股收益)
数据用途概述:
该数据集适用于股票市场分析、交易策略研究、预测模型开发等多种场景。研究人员可利用此数据进行基本面和技术面分析;交易者可以使用技术指标生成买卖信号进行策略测试;教育者可利用此数据进行金融分析课程的教学。此外,数据集也适合用于市场趋势预测和投资决策支持。