数据科学平台文章内容与互动数据集-2010-2021
数据来源:互联网公开数据
标签:数据科学,文章,内容分析,互动,阅读量,作者,出版日期,Medium,数据挖掘
数据概述:
本数据集包含了2010年至2021年期间,数据科学平台“Towards Data Science”上发表的文章信息。该平台是加拿大注册的一家公司,旨在为数千人提供交流想法、扩展数据科学知识的平台。数据集定期更新,数据来源于https://towardsdatascience.com/archive。截至目前,数据集包含48060篇文章,并涵盖了以下8个关键字段:
出版日期
文章标题
作者
文章链接
鼓掌数量
评论数量
阅读时长(基于成年人平均阅读速度,约265字/分钟)
付费或免费文章(是否参与Medium合作伙伴计划)
数据用途概述:
该数据集适用于多种研究和分析场景,包括:文章内容分析、用户阅读行为分析、作者影响力评估、平台内容趋势研究、以及数据科学领域的知识传播研究。研究人员可以利用该数据分析不同主题文章的受欢迎程度;内容创作者可以了解文章的阅读反馈和互动情况;平台运营者可以分析用户行为,优化内容推荐策略;学术研究者可以进行数据挖掘,探索数据科学领域的发展趋势。