数据科学大学出版物数据集

数据科学大学出版物数据集 数据来源:互联网公开数据
标签:数据科学,机器学习,学术出版物,大学研究,作者分析,学术趋势,研究产出,技术发展

数据概述:
本数据集包含从Google Scholar个人资料中提取的学术出版物信息,使用scholarly Python模块进行数据采集。数据集分为两部分:
1. topic_publications:基于数据科学领域的热门和技术术语进行查询生成的出版物数据,包含作者名称、出版物名称、摘要、引用次数、出版年份、来源、DOI、链接等信息。
2. university_publications:通过爬取与美国顶尖数据科学/机器学习相关大学的作者个人资料生成的出版物数据,包含类似的字段信息。
数据集还提供了两部分数据的合并版本,便于统一分析。

数据用途概述:
该数据集适用于多种研究和分析场景:
1. 研究数据科学领域的学术发展趋势,分析热门主题和关键技术的演变。
2. 评估不同大学或研究机构在数据科学领域的研究产出和影响力。
3. 分析作者的学术贡献,研究学者之间的合作网络。
4. 探索数据科学领域的重要出版物和高被引论文,为学术研究提供参考。
5. 支持教育和培训,帮助学生和研究人员了解数据科学领域的研究现状和方向。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 25, 2025, 02:14 (UTC)
创建于 四月 25, 2025, 01:58 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。