COVID-19西班牙语推文数据集

COVID-19西班牙语推文数据集 数据来源:互联网公开数据
标签:COVID-19, 西班牙语, 推文, 时间序列, 文本分析, 情感分析, 传播趋势

数据概述:
本数据集收录了2020年4月1日至2020年5月1日期间关于COVID-19的相关西班牙语推文。数据来源为Kaggle平台上的公开数据集,覆盖了全球范围内的西班牙语推文,共计约227万条。其中,西班牙地区推文约24,000条,巴拉圭地区推文约1,280条。数据集包含22个字段,涵盖推文文本、国家代码、语言等信息,并排除了转推内容。此外,数据集还提供了西班牙语推文的词频分析(1-gram)。

数据用途概述:
该数据集适用于对西班牙语社交媒体文本进行分析,尤其适合用于研究COVID-19疫情期间西班牙语国家和地区公众的讨论热点、情感倾向及信息传播趋势。研究人员可利用此数据进行文本挖掘、情感分析和传播动力学研究;企业或机构可基于数据评估公众对疫情的态度变化;学术领域可用于支持语言学研究、社会行为分析及公共卫生政策的制定。此外,数据集也适合用于教学和培训,帮助学习者掌握社交媒体文本分析的方法与工具。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 326.08 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。