在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru

在线新闻流行度数据集OnlineNewsPopularityDataset-ayushmudunuru

数据来源:互联网公开数据

标签:在线新闻,流行度分析,数据集,机器学习,文本分析,社交媒体,新闻传播,社交网络

数据概述:该数据集来自葡萄牙新闻聚合网站“Portal Ursamaior”,记录了2013年至2018年期间发布的39644篇新闻文章的特征及其在线传播情况。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2018年。 地理范围:数据涵盖了葡萄牙地区发布的新闻。 数据维度:数据集包括新闻的标题,频道,字数,图像数量,视频数量,共享数量,社交网络反馈等信息。此外,还包括新闻发布时的LDA主题分布,以及根据LDA模型提取的新闻主题标签。 数据格式:数据提供为CSV格式,便于进行分析和处理。 来源信息:数据来源于葡萄牙新闻聚合网站“Portal Ursamaior”,已进行标准化和清洗。 该数据集适合用于新闻传播学,社交媒体分析,文本挖掘和机器学习等领域的研究和应用,特别是在新闻流行度预测,主题分类和用户行为分析等方面具有重要价值。

数据用途概述:该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于新闻流行度预测,用户行为分析,新闻主题分类等研究,如新闻传播模式研究,用户参与度分析等。 行业应用:可以为新闻媒体,广告公司和市场研究机构提供数据支持,特别是在新闻价值评估,用户偏好分析和广告效果评估方面。 决策支持:支持新闻内容优化,用户参与度提升和广告投放策略优化。 教育和培训:作为新闻传播学,数据科学和机器学习课程的辅助材料,帮助学生和研究人员深入理解在线新闻分析,用户行为分析和预测建模技术。 此数据集特别适合用于探索在线新闻传播的规律与趋势,帮助用户实现新闻流行度预测,用户行为分析和广告效果评估等目标,为新闻媒体和广告公司提供数据支持。

packageimg

数据与资源

附加信息

字段
版本 1
数据集大小 7.13 MiB
最后更新 2025年4月24日
创建于 2025年4月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。