金融情绪词典情感分析数据集FinancialSentimentLexiconAnalysisDataset-adeshtrivedi
数据来源:互联网公开数据
标签:情绪分析, 词典, 金融, 文本分析, 情感词典, 财务报告, 自然语言处理, 文本挖掘
数据概述:
该数据集包含来自Loughran-McDonald Master Dictionary的数据,记录了1993年至2021年间金融领域中常用词汇的情感倾向和相关统计信息。主要特征如下:
时间跨度:数据记录的时间范围为1993年至2021年。
地理范围:数据主要关注金融领域,未明确具体地理范围,但可应用于全球范围内的金融文本分析。
数据维度:数据集包括Word(词汇)、Seq_num(词汇序号)、Word Count(词汇总计数)、Word Proportion(词汇占比)、Average Proportion(平均占比)、Std Dev(标准差)、Doc Count(文档计数)、Negative(负面情绪)、Positive(正面情绪)、Uncertainty(不确定性)、Litigious(诉讼倾向)、Strong_Modal(强模态词)、Weak_Modal(弱模态词)、Constraining(约束性)、Syllables(音节数)和Source(来源)等多个字段。
数据格式:CSV格式,文件名为Loughran-McDonald_MasterDictionary_1993-2021.csv,方便数据分析和处理。
来源信息:数据来源于Loughran-McDonald Master Dictionary,该词典被广泛应用于金融领域的情感分析研究。
该数据集适合用于金融文本的情感分析、财务报告分析、自然语言处理等研究和应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融文本的情感分析研究,如财务报告的情感分析、新闻评论的情感倾向分析等。
行业应用:可以为金融机构、投资公司、市场研究机构提供数据支持,用于风险评估、市场预测、投资决策等。
决策支持:支持金融领域的决策制定,例如,通过分析新闻、社交媒体等文本数据,辅助投资决策。
教育和培训:作为自然语言处理、金融学等相关课程的辅助材料,帮助学生和研究人员深入理解金融文本的情感分析。
此数据集特别适合用于探索金融领域中词汇的情感倾向和相关统计信息,帮助用户实现对金融文本的深入理解和分析,并应用于风险管理、投资策略制定等领域。