基于真实用户宠物领养配对数据集2026

数据集概述

本数据集包含7500条用户-宠物配对的领养记录,涵盖2500个独特用户和7500只宠物。数据跨越2020至2026年,地理范围为美国加州。每条记录包含用户人口统计学信息、宠物属性、领养时间序列及结果。数据的采纳速度分为0-4五个等级,标注了宠物被领养的快速程度。领养成功率约为90%。 基于San Jose Animal Care Center、Long Beach Animal Shelter真实收容所数据、以及宠物养护人群调查报告(AVMA 2022-2025、Hill's Pet Nutrition 2024、Mob Research Institute 2022-2025)

文件详解

  • 文件名称:synthetic_pet_adoption_dataset.csv
  • 文件格式:CSV(逗号分隔值)
  • 编码方式:UTF-8
  • 记录数:7500行(含表头)
  • 字段数:35列

  • 用户维度字段(12列)

  • UserID:用户唯一标识(U000000-U002499,共2500个)
  • UserAge:领养者年龄(20-74岁,平均46.5岁)
  • UserGender:性别(Male/Female,比例约48:52)
  • UserIncomeLevel:收入分级(Low/Medium/High/Very High)
  • UserIncomeUSD:年收入(美元,范围2万-30万,平均约9.1万)
  • UserEducation:学历(High School/Associate/Bachelor/Master/PhD)
  • UserMaritalStatus:婚姻状况(Single/Married/Divorced/Widowed)
  • UserHousingType:住房类型(Apartment/House/Condo)
  • UserHasOtherPets:是否有其他宠物(0/1,分布约55:45)
  • UserMotivation:领养动机(Companionship/Save Animal/Family Need/Emotional Support/Activity Partner)
  • UserCity:城市(San Jose/Long Beach/Los Angeles/Cerritos/Signal Hill/Santa Ana)
  • UserState:州代码(CA)

  • 宠物维度字段(15列)

  • PetID:宠物唯一标识(P0000000-P7499999,共7500只)
  • PetType:宠物类型(Dog/Cat,比例约45:55)
  • PetBreed1:主要品种(犬10种/猫5种)
  • PetBreed2:第二品种或Mixed标记
  • PetGender:宠物性别(Male/Female,比例约48:52)
  • PetAgeMonths:年龄(月,0-120个月,平均23.4个月)
  • PetColor1:主要颜色(Black/White/Brown/Gray/Orange/Tabby/Calico/Cream/Red)
  • PetColor2:次要颜色(部分缺失约10%)
  • PetMaturitySize:成熟体型(0-4,0=未指定,1=小,2=中,3=大,4=特大)
  • PetFurLength:毛发长度(0-3,0=未指定,1=短,2=中,3=长)
  • PetHealthStatus:健康状况(0-3,0=未指定,1=健康,2=轻微,3=严重)
  • PetVaccinated:疫苗接种(1=是,2=否,3=不确定,分布约60:25:15)
  • PetDewormed:驱虫状态(1=是,2=否,3=不确定,分布约55:30:15)
  • PetSterilized:绝育状态(1=是,2=否,3=不确定,分布约50:35:15)
  • PetAdoptionFeeUSD:领养费(0/75/150/200美元)

  • 时间维度字段(3列)

  • IntakeDate:入院日期(格式YYYY-MM-DD,范围2020-01-01至2026-03-23)
  • OutcomeDate:结果日期(格式YYYY-MM-DD,保证晚于等于入院日期)
  • DaysInShelter:滞留天数(0-365天,平均43.2天,中位数19天)

  • 采纳序列与结果字段(5列)

  • AdoptionAttempt:领养尝试次数(1-3,同一用户最多3条记录)
  • AdoptionSpeed:采纳速度(0-4,0=当天,1=1周,2=1月,3=3月,4=未采纳)
  • OutcomeType:结果类型(Adoption/Return/Transfer/Euthanasia)
  • AdoptionSuccess:是否成功领养(0/1二值,成功率约89.8%)

数据来源

合成数据集

适用场景

  • 采纳速度预测:构建多分类模型预测宠物被领养的快速程度,识别快速和困难的领养情况。
  • 领养成功预测:训练二分类或多分类模型预测特定用户-宠物配对是否能成功完成领养。
  • 用户画像分析:研究不同人口统计学背景(年龄、收入、教育)的用户在宠物选择和领养成功率上的差异。
  • 宠物特征影响评估:分析宠物健康状况、年龄、品种等属性对被领养难度和速度的影响。
  • 因素重要性分析:通过特征重要性排序,识别影响领养决策的关键因素。
  • 时间序列分析:研究用户多次领养的行为模式、失败后重试的特征和时间间隔。
  • 用户宠物匹配优化:探索用户特征与宠物类型、大小、性格的最优匹配组合。
  • 收容所经营决策:为收容所的宠物展示策略、定价、营销和资源分配提供数据支持。
  • 机器学习教学与实践:提供完整、高质量的真实场景数据集,用于数据科学和机器学习课程。
  • 推荐系统开发:构建宠物推荐或用户推荐系统,改善领养匹配效率。
packageimg

数据与资源

附加信息

字段
作者
版本 1.0
数据集大小 0.21 MiB
最后更新 2026年3月25日
创建于 2026年3月25日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。