全球女性新闻报道性别偏见分析数据集2010-2020
数据来源:互联网公开数据
标签:女性报道,性别偏见,新闻分析,时间序列,语言分析,媒体研究,性别研究
数据概述:
本数据集包含2010年至2020年间全球四大国家(美国、英国、印度、南非)前50大新闻出版机构和新闻机构发布的新闻头条数据。数据集通过RapidAPI的Google新闻API收集,基于现有研究选择关键词进行抓取。数据集包含新闻头条文本、发布时间、发布国家、性别偏见分数等关键信息,并通过手动编写的性别化词汇和刻板印象词汇字典以及自然语言处理技术对新闻进行分类和分析。
数据用途概述:
该数据集适用于性别研究、新闻分析、媒体研究等多种场景。研究人员可以利用此数据探索不同新闻机构和国家间女性报道的性别偏见趋势,分析新闻中女性形象的演变,为促进性别平等提供数据支持。此外,教育工作者可以使用数据集进行教学,增强学生对性别偏见现象的认知。
举例:
通过分析数据集中的“headline_no_site”和“bias”字段,研究者可以对比不同国家的新闻机构在报道女性时的性别偏见程度,识别出哪些词汇和主题更容易导致性别偏见。例如,比较“犯罪”和“赋权”两类主题在女性报道中的出现频率和偏见分数,可以发现媒体在报道女性参与社会活动时是否存在差异。