印度尼西亚移动应用评论情感与情绪分析数据集-dhiakashabrinaassy

印度尼西亚移动应用评论情感与情绪分析数据集-dhiakashabrinaassy 数据来源:互联网公开数据 标签:移动应用,评论,情感分析,情绪分析,印尼语,数据预处理,文本挖掘,机器学习 数据概述: 本数据集来源于Zenodo网站,是Riccosan和Karen Etania Saputra的研究成果《印尼移动应用评论的多标签多类别情感和情绪数据集》。原始数据集包含21,697条记录,数据形式尚未结构化。为避免包含错误的无关数据,影响模型的准确性和效率,进行了数据预处理。预处理步骤包括:将文本转换为小写、去除标点符号、去除特殊字符、去除空白字符、分词、去除停用词和词干提取处理。词干提取后,数据列表被重新转换为字符串形式。接着,数据集通过去除缺失值和重复数据进行进一步清理,最终数据集包含19,724条记录。 数据用途概述: 该数据集适用于多标签多类别情感和情绪分析、文本挖掘、自然语言处理等场景。研究者可利用此数据集进行模型训练和验证,以提高对印尼移动应用评论中情感和情绪的理解。数据集还适用于教育领域,帮助学生学习和掌握情感与情绪分析的基本技术。此外,数据集也可用于开发相关应用程序或服务,提供更加细致和准确的用户反馈分析。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.41 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。