GitHub平台活跃用户画像数据集

GitHub平台活跃用户画像数据集

数据来源:互联网公开数据

标签:GitHub, 用户, 社交网络, 开源, 开发者, 社区, 数据分析, 开发者画像

数据概述: 本数据集收录了超过15万名GitHub平台上的活跃用户,这些用户均拥有超过69个关注者。数据集包含了丰富的用户属性信息,旨在为研究者提供一个全面了解GitHub用户特征的资源。请注意,GitHub API的服务条款适用。

数据用途概述: 该数据集可用于多种研究和应用场景,包括:用户行为分析、开发者社区研究、开源项目参与者分析、社交网络分析、开发者画像构建等。研究人员可以利用该数据分析用户之间的关系、探讨开发者行为模式、评估开源项目的活跃度,以及识别潜在的合作机会。严禁将此数据集用于垃圾邮件目的,包括出售GitHub用户的个人信息,例如向招聘人员、猎头和求职网站出售。

字段定义:

login:用户的GitHub用户名或登录名,是平台上的唯一标识符。

avatar_url:用户个人资料图片的URL地址。

type:GitHub账户的类型,可以是"User"(个人用户)或"Organization"(组织),用于区分个人用户和团队或公司。

site_admin:布尔值,指示用户是否为GitHub组织的站点管理员。

name:用户的全名,如果用户在其GitHub个人资料中提供了。

company:用户当前或过去的工作单位或公司。

blog:用户关联的个人或专业博客的URL地址。

location:用户的地理位置,用户可能在其GitHub个人资料中指定。

email:用户的电子邮件地址,如果他们选择在GitHub上公开。

hireable:布尔值,指示用户是否开放招聘或正在寻找工作。

bio:用户在GitHub个人资料中提供的简短个人简介或描述,突出其兴趣或专业知识。

twitter_username:用户的Twitter用户名,如果他们已将其链接到GitHub个人资料。

public_repos:用户创建的公共仓库数量。

public_gists:用户创建的公共gist(代码片段)数量。

followers:关注此用户的GitHub用户数量。

following:此用户正在关注的GitHub用户数量。

created_at:用户GitHub账户的创建日期和时间。

updated_at:用户GitHub个人资料的最后更新或修改日期和时间。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 12.9 MiB
最后更新 2025年4月17日
创建于 2025年4月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。