英国新闻头条数据集

英国新闻头条数据集 数据来源:互联网公开数据 标签:英国新闻,头条,新闻网站,RSS订阅,时间序列,政治倾向,新闻媒体分析,读者分析

数据概述: 本数据集包含了英国排名前15的新闻网站在大约20天内的新闻头条。头条是从各网站的RSS订阅源中抓取的。抓取的时间范围是从2023年2月13日至2023年3月5日,每12小时抓取一次。数据集由两个文件组成,一个是抓取的头条数据,另一个是包含各新闻网站附加信息的辅助数据。

数据用途概述: 该数据集适用于新闻媒体分析、读者行为研究、政治倾向分析等多种场景。研究人员可以通过分析头条数据了解不同新闻网站的报道趋势;投资者和广告商可以利用读者分析数据来确定目标受众;政策制定者可以凭借政治倾向分析来评估媒体环境。此外,数据集也适合用于教育培训,帮助学习者理解新闻生态系统和媒体环境的变化。

数据字典(抓取数据): website:BBC, Sun, Mirror, Daily Mail, Independent, Telegraph, Guardian, Manchester Evening News, Sky News, Metro, Daily Express, Times, Liverpool Echo, Birmingham Live, Evening Standard。 timestamp scraped:特定头条被抓取的日期和时间。 headline:新闻文章的头条。

数据字典(辅助数据): website:BBC, Sun, Mirror, Daily Mail, Independent, Telegraph, Guardian, Manchester Evening News, Sky News, Metro, Daily Express, Times, Liverpool Echo, Birmingham Live, Evening Standard。 RSS URL:各上述网站的RSS订阅源的URL。 visitors unique monthly:每月独立访问者数,单位为百万,来源为statista.com。 ownership:持有特定新闻媒体及其网站的实体。来源:一般互联网搜索。 political bias:左中、中立、右中、右。来源:一般互联网搜索。 party support GE 2019:无、保守党、工党、未知。来源:一般互联网搜索。GE = 全国选举。 journalism style:高质量、小报。来源:一般互联网搜索。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 16:53 (UTC)
创建于 四月 14, 2025, 16:53 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。