德语说唱情感分析歌词数据集2023-mxgra93

德语说唱情感分析歌词数据集2023-mxgra93 数据来源:互联网公开数据 标签:德语说唱,歌词,情感分析,自然语言处理,音乐分析,数据科学,Spotipy,Genius

数据概述: 本数据集包含213位德语说唱艺术家的3445首歌曲歌词,并通过使用gpt-3.5-turbo模型添加了三类情感分析字段。这三类情感分析字段分别提供了不同详细程度的情感描述。第一类情感分析包括一个或多个句子,概述歌词的情感和情绪;第二类情感分析则是一份最多包含10种情感的列表;第三类情感分析为六种基本人类情感之一,包括“悲伤”、“快乐”、“恐惧”、“愤怒”、“惊讶”和“厌恶”,这一类情感分析是从第二类中提取并进一步简化得到的。

数据集中的歌词和gpt模型的回答经过表面清理,但有时模型可能偏离指令,给出不符合预期的答案,例如,第一类情感分析的回答可能是单个词(如“积极”),但这种现象很少见。

艺术家的选择是通过调用Spotify API,使用Spotipy Python库实现的。歌词数据则来源于Kaggle上的Genius歌词数据集。

本数据集是一个副项目,旨在对德语说唱的整体情感情况进行概览。近年来,歌词情感分析,尤其是对说唱音乐的情感分析,由于其多层结构和文字游戏而变得非常具有挑战性。然而,随着大型语言模型的发展,如gpt-3.5-turbo,使得此类项目变得可行且易于实现。在尝试使用gpt-3的其他版本如davinci和babbage后发现,结果过于随机且不可用。本项目并未对模型进行微调,但如果有合适的训练数据集以及时间和资源,可以训练类似的模型。gpt-3.5-turbo凭借其内在的世界知识,无需额外训练即可使用。

感谢Genius数据集、Spotipy库和OpenAI团队的支持,使该项目得以顺利进行并充满乐趣!相关的笔记本代码可以在我个人的GitHub页面上找到。

数据用途概述: 该数据集适用于音乐情感分析研究、德语说唱分析、自然语言处理教学、音乐数据分析等多种场景。研究者可以利用该数据集了解德语说唱的整体情感趋势;教师可以将其用于教学和演示;音乐爱好者和分析人士可以借此深入了解德语说唱的情感表达方式。此外,数据集还为自然语言处理领域的研究提供了有价值的资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 6.21 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。