找到5,803个数据集

标签: 文本分析

过滤结果
  • 泰米尔语歌曲歌词数据集

    2025年4月15日   

    泰米尔语歌曲歌词数据集 数据来源:互联网公开数据 标签:泰米尔语,歌曲歌词,音乐产业,文本分析,文化研究,自然语言处理 数据概述: 本数据集包含了超过4000首泰米尔语歌曲的歌词信息,每条记录包括电影名称、歌曲名称及完整的歌词内容。数据集为研究泰米尔语音乐文化及歌词特征提供了丰富的数据基础,适用于多种文本分析和文化研究场景。 数据用途概述:...
    packageimg
  • 乌克兰子版块顶级评论数据集

    2025年4月15日   

    乌克兰子版块顶级评论数据集 数据来源:互联网公开数据 标签:乌克兰,战争,Reddit,顶级评论,社会分析,文本分析,视频内容 数据概述:...
    packageimg
  • 阿拉伯语古兰经经文及其注释数据集

    2025年4月15日   

    阿拉伯语古兰经经文及其注释数据集 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,阿拉伯语,经文,注释,宗教研究,文本分析,语义理解 数据概述:...
    packageimg
  • 大学入学考试作文评分数据集

    2025年4月15日   

    大学入学考试作文评分数据集 数据来源:互联网公开数据 标签:作文评分,自然语言处理,教育评估,大学入学考试,巴西高中,文本分析 数据概述:...
    packageimg
  • 吉尔莫女孩电视剧台词数据集

    2025年4月15日   

    吉尔莫女孩电视剧台词数据集 数据来源:互联网公开数据 标签:电视剧,台词,剧情,角色,影视,文化研究,文本分析 数据概述: 本数据集包含了电视剧《吉尔莫女孩》中出现的所有台词(引言)。数据来源于网络爬取,涵盖了该剧的完整剧情对话内容。数据包括每句台词的来源角色、台词内容、所属剧集季数等关键信息。 数据用途概述:...
    packageimg
  • 多语言平行语料库释义数据集-73种语言

    2025年4月15日   

    多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves...
    packageimg
  • 权力的游戏人物互动关系数据分析数据集

    2025年4月15日   

    权力的游戏人物互动关系数据分析数据集 数据来源:互联网公开数据 标签:权力的游戏,人物关系,社交网络,文本分析,大数据,文学,书籍,互动,关系,文本挖掘 数据概述:...
    packageimg
  • 孟加拉语日常对话数据集

    2025年4月15日   

    孟加拉语日常对话数据集 数据来源:互联网公开数据 标签:孟加拉语,日常对话,语言模型,自然对话,语境感知,人类交流,对话数据集,文本分析,人工智能 数据概述: 本数据集旨在解决为自然、语境感知且类人对话调整语言模型的挑战。数据集包含超过20,000次对话,全面展示了孟加拉国的各种日常生活情境下的交流,涵盖了广泛的社会互动场景。...
    packageimg
  • 宾夕法尼亚大学语料库初步版本数据集

    2025年4月15日   

    宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:...
    packageimg
  • 美国保守派智库-2025计划-政策建议文本数据集

    2025年4月15日   

    美国保守派智库-2025计划-政策建议文本数据集 数据来源:互联网公开数据 标签:政治,政策,保守主义,智库,美国,政府,公共政策,文本分析,机器学习,意识形态 数据概述: 本数据集收录了美国保守派智库传统基金会(The Heritage...
    packageimg
  • 圣经与古兰经情感分析数据集

    2025年4月15日   

    圣经与古兰经情感分析数据集 数据来源:互联网公开数据 标签:圣经,古兰经,情感分析,文本分析,自然语言处理,NLP,宗教文本,情感词典,情感极性,词频统计,词云 数据概述: 本数据集包含了《圣经》(King James Version,...
    packageimg
  • 孟加拉语同义句识别基准语料库数据集

    2025年4月15日   

    孟加拉语同义句识别基准语料库数据集 数据来源:互联网公开数据 标签:同义句检测,孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言模型评估 数据概述: 本数据集是一个用于孟加拉语同义句识别的基准语料库,收录了8,787对人工标注的句子对,这些句子对来源于23家报纸头版在四个类别中的内容。该数据集旨在为孟加拉语同义句检测的研究提供全面的基准。...
    packageimg
  • 社交媒体平台Reddit上-鸟类并非真实存在-主题讨论数据集

    2025年4月15日   

    社交媒体平台Reddit上-鸟类并非真实存在-主题讨论数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,阴谋论,恶搞,鸟类,生成Z世代,文本分析,情感分析,主题建模 数据概述:...
    packageimg
  • 推特-我们来评价狗狗-用户互动情感分析数据集

    2025年4月15日   

    推特-我们来评价狗狗-用户互动情感分析数据集 数据来源:互联网公开数据 标签:推特,社交媒体,宠物,狗狗,情感分析,用户互动,数据挖掘,文本分析 数据概述: 本数据集来源于推特(Twitter)上最受欢迎的账号“we rate...
    packageimg
  • 披萨哥故事数据集

    2025年4月15日   

    披萨哥故事数据集 数据来源:互联网公开数据 标签:披萨哥,Reddit,社交媒体,文本分析,NLP,娱乐,数据分析 数据概述: 本数据集收录了来自Reddit社区r/TalesFromThePizzaGuy的帖子和评论,时间范围为每日更新。数据集通过Kaggle的定时任务自动收集,涵盖丰富的用户生成内容,包括趣事、幽默故事和日常分享。 数据用途概述:...
    packageimg
  • Instagram应用商店用户评价与评分数据集-全球用户反馈

    2025年4月15日   

    Instagram应用商店用户评价与评分数据集-全球用户反馈 数据来源:互联网公开数据 标签:Instagram,用户评价,应用商店,Appstore,社交媒体,情感分析,文本分析,用户体验,全球视角 数据概述:...
    packageimg
  • 当代美国英语语料库数据集

    2025年4月15日   

    当代美国英语语料库数据集 数据来源:互联网公开数据 标签:美国英语,语料库,语言学,文本分析,文学,新闻,学术,社交媒体,电影字幕,电视字幕 数据概述:...
    packageimg
  • 单词难度预测数据集

    2025年4月15日   

    单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv...
    packageimg
  • 阿黛尔新歌EasyOnMe发布首日推特用户情感分析数据集-2021年10月15日

    2025年4月15日   

    阿黛尔新歌EasyOnMe发布首日推特用户情感分析数据集-2021年10月15日 数据来源:互联网公开数据 标签:阿黛尔,EasyOnMe,推特,社交媒体,情感分析,文本分析,音乐,新歌发布,舆情,话题 数据概述: 本数据集收录了2021年10月15日阿黛尔(Adele)新单曲《Easy On...
    packageimg
  • 比特币新闻文章文本语料库数据集

    2025年4月15日   

    比特币新闻文章文本语料库数据集 数据来源:互联网公开数据 标签:比特币,新闻文章,文本分析,情感分析,主题建模,词嵌入,金融分析,数据挖掘 数据概述:...
    packageimg