数据集

印尼语社交媒体情感分析数据集IndonesianSocialMediaSentimentAnalysisDataset-sahatgsihotang

数据来源：互联网公开数据

标签：情感分析, 社交媒体, 印尼语, 文本分类, 自然语言处理, 情感极性, 文本预处理, 数据清洗

数据概述：该数据集包含来自印尼社交媒体平台的数据，记录了用户评论及其情感极性。主要特征如下：时间跨度：数据未标明具体时间，视作静态语料数据集使用。地理范围：数据主要来源于印尼社交媒体平台，覆盖印尼用户。数据维度：数据集包含用户评论文本（review）和情感标签（sentimen），以及其他辅助字段。情感标签通常为二分类，例如0代表负面情感，1代表正面情感。数据格式：CSV格式，包含多个CSV文件，如“Data ADAKAMI - kamusnormalisasicsv-1.csv”、“Data ADAKAMI - 2k data (1)csv-1.csv”、“kamusnormalisasi_barucsv-1.csv”和“new_stopwordcsv.csv”，便于文本处理和情感分析。其中，部分文件包含用于文本预处理的词典和停用词表。来源信息：数据来源于印尼社交媒体平台，并经过了标注和预处理，以支持情感分析任务。该数据集特别适用于印尼语文本情感分析的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、情感分析、文本挖掘等领域的学术研究，如印尼语情感分析模型的构建、情感极性预测、情绪识别等。行业应用：为社交媒体监控、品牌声誉管理、市场调研等行业提供数据支持，尤其适用于分析用户对产品和服务的评价。决策支持：支持企业了解用户反馈，优化产品和服务，提升用户满意度。教育和培训：作为自然语言处理、文本挖掘等课程的实训数据，帮助学生和研究人员深入理解情感分析的流程和方法。此数据集特别适合用于探索印尼语社交媒体评论中的情感表达规律，帮助用户构建情感分析模型，提升情感极性预测的准确性。

数据与资源

versions_20250410025616.zipZIP
0.35 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.35 MiB
最后更新	2025年5月1日
创建于	2025年5月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

印尼语社交媒体情感分析数据集IndonesianSocialMediaSentimentAnalysisDataset-sahatgsihotang

数据与资源

附加信息

注册成功！