澳大利亚城市推文数据集

澳大利亚城市推文数据集 数据来源:互联网公开数据
标签:澳大利亚,城市,推文,情感分析,社交媒体,时间序列,自然语言处理

数据概述
本数据集包含2020年7月12日至7月25日期间,与澳大利亚主要城市相关的推文记录。每条推文记录包含了推文文本、创建时间、情感极性等关键信息。数据集中的推文通过Twitter搜索API获取,并通过Melbourne、Sydney等城市相关标签筛选。情感极性字段使用NLTK中的Vader模型计算得出,为分析推文的情感倾向提供了量化指标。此外,数据集提供了推文的搜索查询、创建时间戳以及推文所属城市等元数据,便于多维度分析。

数据用途概述
该数据集适用于以下场景:
1. 城市形象研究:通过分析推文内容和情感极性,了解公众对澳大利亚各城市的看法,包括正面或负面情绪,以及使用频率较高的描述性词语。
2. 社交媒体趋势分析:研究特定时间段内关于澳大利亚城市的推文分布和情感变化,帮助识别热点话题或事件。
3. 情感分析:利用情感极性字段,进行情感分类和趋势分析,为城市营销或品牌传播策略提供支持。
4. 城市比较研究:对比不同城市的推文情感和频率,评估各城市在社交媒体上的关注度和形象差异。
5. 数据展示与可视化:数据集中的字段设计便于使用Tableau等工具进行地理空间可视化,例如绘制城市情感分布热图或时间序列分析。

数据集字段说明
- text:推文的完整文本内容。
- created_at:推文的创建时间,格式为日期和时间戳。
- search_query:用于搜索推文的查询关键词或标签。
- polarity:推文的情感极性,通过Vader模型计算得到,范围为-1(极度负面)到1(极度正面)。
- city:推文所属的城市,通过文件名字段推断得出,方便进行地理分析。

数据特点
- 时间范围:数据覆盖2020年7月12日至7月25日,每月会更新一次。
- 情感分析:使用NLTK中的Vader模型进行情感计算,提供了量化的情感极性值。
- 城市维度:通过文件名字段关联城市信息,便于按城市维度进行数据分组和分析。

注意事项
1. 在2020年7月22日之前,可能存在少量重复的推文ID,但已通过更新修复此问题。
2. 数据集为公开数据,可用于研究、分析和教育等非商业用途,但需遵守相关法律法规及社交媒体平台的使用政策。

数据价值
该数据集为研究澳大利亚城市在社交媒体上的形象和公众看法提供了宝贵的信息资源,有助于理解城市品牌建设、公众态度变化以及社交媒体传播规律。数据集的结构设计便于分析和可视化,适合学术研究、市场分析和政策制定等场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 15.77 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。