数据集

推特情感分析处理数据集-2011-halemogpa

推特情感分析处理数据集-2011-halemogpa 数据来源：互联网公开数据标签：推特,情感分析,NLP,机器学习,数据集,预处理,分词

数据概述：本数据集是Sentiment140语料库的处理版本，包含160万条带有二元情感标签的推特。原始数据经过清洗、分词及处理，适用于自然语言处理（NLP）和机器学习任务。该数据集提供了丰富的资源，适用于情感分析、文本分类和其他NLP应用场景。数据集包括完整的处理语料库（train-processed.csv）和一个包含10,000条推特的较小样本（train-processed-sample.csv），方便快速实验和模型原型开发。

数据用途概述：该数据集适用于各种NLP任务和模型架构，包括情感分析、文本分类、用户行为研究和自然语言生成等。研究人员和开发者可以利用此数据集进行模型训练、评估和优化；教育机构可以将此数据集用于教学和实验；企业和组织可以利用情感分析结果进行市场调研和产品改进。

引用：如果您在研究或项目中使用了本数据集，请引用原始的Sentiment140数据集： Go, A., Bhayani, R. 和 Huang, L., 2009. Twitter sentiment classification using distant supervision. CS224N Project Report, Stanford, 1(2009), p.12.

数据与资源

versions_20250412075825.zipZIP
115.68 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	115.68 MiB
最后更新	2025年5月4日
创建于	2025年5月4日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

推特情感分析处理数据集-2011-halemogpa

数据与资源

附加信息

注册成功！