网络流行语词典数据集-2021年

网络流行语词典数据集-2021年 数据来源:互联网公开数据 标签:流行语,网络语言,词典,文本分析,自然语言处理,数据挖掘,社会学研究

数据概述: 本数据集包含截至2021年6月1日Urban Dictionary网站上收录的所有单词、其含义和句子示例。数据集涵盖超过228万个条目,每个单词按其首字母分组,每个字母对应一个包含数据的CSV文件。数据集结构清晰且易于访问,适合进行多种文本分析和自然语言处理任务。

数据字段包括:

  • character:单词的首字母
  • browsing_page_url:显示该单词所在的浏览页面URL
  • word_url:每个单词的唯一URL,页面中包含其定义和句子示例
  • word:流行语、短语或缩写
  • definition:单词的含义
  • sentence:单词的句子示例

数据用途概述: 该数据集适用于多种研究和分析场景,包括主题建模、文本聚类、过滤不当语言以及社会语言学研究。研究人员可以利用数据集进行流行语的演变分析,了解网络语言的使用模式;教育者可以利用数据集进行语言学教学;开发人员可以基于数据集构建语言处理应用。此外,数据集也适合用于文化研究,帮助理解互联网时代的语言变迁和社会文化现象。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 325.81 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。