姓名性别与种族数据集

姓名性别与种族数据集 数据来源:互联网公开数据 标签:姓名,性别,种族,人口统计,数据生成,数据分析,自然语言处理 数据概述: 本数据集结合了名字与性别、种族/族裔的信息关联,每个条目提供了基于性别和种族的第一名或中间名的概率P(Name|Gender,Race)。对于姓氏,数据集仅包含种族信息,每个条目提供了基于种族的姓氏概率P(Name|Race)。该数据集旨在维护名字的原始格式,以保持其自然呈现。 数据用途概述: 此数据集适用于生成基于人口统计数据的统计上准确的名字。它可用于模拟真实世界中的名字分布,帮助研究人员和开发者进行相关数据分析。此外,数据集也可以用于其他相关任务,如自然语言处理中的名字识别和生成。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.52 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。