Allociné法国电影评论情感分析数据集

Allociné法国电影评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析, 法语, 电影评论, 文本数据, 机器学习, 自然语言处理 数据概述: 本数据集源自Allociné电影评论,用于法国电影评论的情感分析研究。数据集由Theophile Blard创建并收集,包含约20万条电影评论,其中训练集约占80%,验证集和测试集各占10%。

数据集包含三个文件:train.csv、validation.csv和test.csv。每个文件包含三个变量:

film-url:指向原始电影评论的链接。 review:电影评论文本,最长2000个字符。 polarity:二元变量,表示评论的情感极性,正向或负向。

关于数据收集和标注的详细信息,请参考项目GitHub页面:https://github.com/TheophileBlard/french-sentiment-analysis-with-bert/tree/master/allocine_dataset

数据用途概述: 该数据集适用于情感分析模型的训练和评估,以及法语文本处理的研究。研究人员可以使用该数据进行情感分类、文本分类、自然语言处理等任务。例如,可以训练模型来预测电影评论的情感极性,分析观众对电影的看法,或进行其他文本挖掘任务。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 45.26 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。