英国新闻头条数据集
数据来源:互联网公开数据
标签:英国新闻,头条,新闻网站,RSS订阅,时间序列,政治倾向,新闻媒体分析,读者分析
数据概述:
本数据集包含了英国排名前15的新闻网站在大约20天内的新闻头条。头条是从各网站的RSS订阅源中抓取的。抓取的时间范围是从2023年2月13日至2023年3月5日,每12小时抓取一次。数据集由两个文件组成,一个是抓取的头条数据,另一个是包含各新闻网站附加信息的辅助数据。
数据用途概述:
该数据集适用于新闻媒体分析、读者行为研究、政治倾向分析等多种场景。研究人员可以通过分析头条数据了解不同新闻网站的报道趋势;投资者和广告商可以利用读者分析数据来确定目标受众;政策制定者可以凭借政治倾向分析来评估媒体环境。此外,数据集也适合用于教育培训,帮助学习者理解新闻生态系统和媒体环境的变化。
数据字典(抓取数据):
website:BBC, Sun, Mirror, Daily Mail, Independent, Telegraph, Guardian, Manchester Evening News, Sky News, Metro, Daily Express, Times, Liverpool Echo, Birmingham Live, Evening Standard。
timestamp scraped:特定头条被抓取的日期和时间。
headline:新闻文章的头条。
数据字典(辅助数据):
website:BBC, Sun, Mirror, Daily Mail, Independent, Telegraph, Guardian, Manchester Evening News, Sky News, Metro, Daily Express, Times, Liverpool Echo, Birmingham Live, Evening Standard。
RSS URL:各上述网站的RSS订阅源的URL。
visitors unique monthly:每月独立访问者数,单位为百万,来源为statista.com。
ownership:持有特定新闻媒体及其网站的实体。来源:一般互联网搜索。
political bias:左中、中立、右中、右。来源:一般互联网搜索。
party support GE 2019:无、保守党、工党、未知。来源:一般互联网搜索。GE = 全国选举。
journalism style:高质量、小报。来源:一般互联网搜索。