英国文学NLP标注短语数据集

英国文学NLP标注短语数据集 数据来源:互联网公开数据 标签:英国文学,NLP,短语标注,作家,书籍,世纪,句子分析,文学研究 数据概述: 本数据集汇集了14至21世纪著名英国作家的作品,包含威廉·莎士比亚、乔治·奥威尔、简·奥斯汀等13位作家的句子级标注数据。数据通过自然语言处理技术从经典英国小说中逐句提取,并按作家、书名和世纪进行了分类标注。数据集结构完整,无缺失值,每条记录包含句子内容、作家名称、书名及所属世纪等信息。 数据用途概述: 该数据集适用于自然语言处理模型的构建,具体包括:识别特定世纪的英文短语;判断英文短语与哪位英国作家的风格相似;训练识别非正式非科学表达的NLP模型;结合新闻数据预测句子是否涉及文学内容;以及检测短语是否具有浪漫文学特征。每个句子末尾均包含作家名、书名和世纪标签,便于分析和建模。 举例: 数据集中的一条记录示例如下:

如果将此数据集用于您的研究,请引用数据集地址。 敬上。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.92 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。