莎士比亚戏剧台词文本与人物角色数据集

莎士比亚戏剧台词文本与人物角色数据集 数据来源:互联网公开数据 标签:莎士比亚,戏剧,文学,文本分析,自然语言处理,角色,台词,英语文学,戏剧分析,文化研究 数据概述: 本数据集收录了威廉·莎士比亚所有戏剧的完整台词,并按剧名、剧种、角色等进行了分类。数据包含108,093行,9个字段,涵盖了莎士比亚不同戏剧中的台词信息,是文学分析、自然语言处理以及研究这位英国文学巨匠的宝贵资源。

字段说明: play_name:剧名。 genre:剧种(喜剧、历史剧、悲剧)。 character:角色名称。 act:幕数。 scene:场景数。 sentence:台词在场景中的行号。 text:台词文本。 sex:角色性别,反映了莎士比亚作品中多元的角色构成。

数据用途概述: 该数据集可用于多种研究和应用场景,包括: 文本分析:使用自然语言处理技术分析莎士比亚的语言风格、主题和人物发展。 性别研究:探索不同戏剧和剧种中性别的呈现方式。 教育工具:创建教育内容和分析工具,帮助学生和学者深入理解莎士比亚的作品。 情感分析:确定台词的情感倾向,并分析其在不同剧种和角色中的变化。 主题建模:识别不同戏剧中的主要主题。 网络分析:分析角色之间的互动,绘制戏剧中的社会关系网络。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.65 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。