找到937个数据集

标签: 文本数据

过滤结果
  • Flipkart手机用户评论情感分析数据集

    2025年4月15日   

    Flipkart手机用户评论情感分析数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,用户反馈,电商,文本数据,自然语言处理,产品评价 数据概述: 本数据集包含了来自 Flipkart...
    packageimg
  • 阿拉伯语故事生成数据集

    2025年4月15日   

    阿拉伯语故事生成数据集 数据来源:互联网公开数据 标签:MSA,叙事生成,阿拉伯语故事,故事生成,文本数据,自然语言处理,机器学习,故事创作 数据来源: 本数据集由不列颠哥伦比亚大学自然语言处理小组(UBC-NLP)整理发布,详细信息可参考其GitHub仓库:https://github.com/UBC-NLP/arastories.git。作者包括...
    packageimg
  • 多语言平行语料库释义数据集-73种语言

    2025年4月15日   

    多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves...
    packageimg
  • 印尼语评论情感分析数据集SERFEE

    2025年4月15日   

    印尼语评论情感分析数据集SERFEE 数据来源:互联网公开数据 标签:情感分析,印尼语,文本数据,机器学习,自然语言处理,评论,情感分类 数据概述: 本数据集专为印尼语情感分析任务设计,通过整合“indonlu”和“google-play-...
    packageimg
  • Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题

    2025年4月15日   

    Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱 数据概述:...
    packageimg
  • 林肯公园YouTube视频评论情感分析数据集

    2025年4月15日   

    林肯公园YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:林肯公园,YouTube,视频,评论,情感分析,自然语言处理,用户反馈,音乐,社交媒体,文本数据 数据概述: 本数据集包含两部分数据,分别关于YouTube上林肯公园(Linkin...
    packageimg
  • 莎士比亚十四行诗菲律宾语翻译数据集

    2025年4月15日   

    莎士比亚十四行诗菲律宾语翻译数据集 数据来源:互联网公开数据 标签:莎士比亚,十四行诗,翻译,菲律宾语,Tagalog,文本数据,文学,语言学 数据概述: 本数据集包含威廉·莎士比亚十四行诗的ASCII文本,总共有超过2,450行。原文本从Andrej Karpathy的GitHub仓库minGPT复制而来。随后,我们使用ChatGPT...
    packageimg
  • 猫途鹰酒店评论情感分析数据集

    2025年4月15日   

    猫途鹰酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,语义分析,用户评价,文本数据,旅游,消费者行为,自然语言处理 数据概述:...
    packageimg
  • YouTube-Twitter和短信垃圾信息数据集

    2025年4月15日   

    YouTube-Twitter和短信垃圾信息数据集 数据来源:互联网公开数据 标签:垃圾信息,短信,社交媒体,YouTube,Twitter,文本数据,自然语言处理,垃圾邮件检测 数据概述: 本数据集整合了多个公开的垃圾信息数据集,旨在为垃圾信息检测、文本分类等研究提供数据资源。数据集主要由三部分组成:...
    packageimg
  • 银行客户推文情感分析数据集

    2025年4月15日   

    银行客户推文情感分析数据集 数据来源:互联网公开数据 标签:银行,客户,推文,情感分析,尼日利亚,社交媒体,文本数据,自然语言处理 数据概述:...
    packageimg
  • 亚马逊电子产品评论情感分析数据集

    2025年4月15日   

    亚马逊电子产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,电子产品,评论,情感分析,消费者行为,文本数据,机器学习,自然语言处理 数据概述: 本数据集包含约3000条来自亚马逊电子产品部门的约200个产品的产品评论,旨在用于深入理解亚马逊平台上产品的用户情感。数据集包含了用户对产品的文字评价,为情感分析提供了基础。...
    packageimg
  • 多轮对话提示数据集

    2025年4月15日   

    多轮对话提示数据集 数据来源:互联网公开数据 标签:多轮对话,文本数据,自然语言处理,机器学习,对话系统,数据标注,人工智能聊天机器人 数据概述:...
    packageimg
  • 莎士比亚作品词汇数据集

    2025年4月15日   

    莎士比亚作品词汇数据集 数据来源:互联网公开数据 标签:莎士比亚, 文学, 词汇分析, 文本数据, 语言学研究, Google BigQuery, 开源数据 数据概述: 本数据集来源于Google BigQuery的公开数据集bigquery-public-...
    packageimg
  • 英国广播公司BBC新闻文章文本分类数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:...
    packageimg
  • Skillbox教育VKontakte官方账号帖子内容数据集-2016-2020年

    2025年4月15日   

    Skillbox教育VKontakte官方账号帖子内容数据集-2016-2020年 数据来源:互联网公开数据 标签:社交媒体, VKontakte, 帖子, Skillbox, 教育, 数据分析, 内容分析, 文本数据 数据概述:...
    packageimg
  • Allociné法国电影评论情感分析数据集

    2025年4月15日   

    Allociné法国电影评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析, 法语, 电影评论, 文本数据, 机器学习, 自然语言处理 数据概述: 本数据集源自Allociné电影评论,用于法国电影评论的情感分析研究。数据集由Theophile Blard创建并收集,包含约20万条电影评论,其中训练集约占80%,验证集和测试集各占10%。...
    packageimg
  • 社交媒体公共群组帖子数据集

    2025年4月15日   

    社交媒体公共群组帖子数据集 数据来源:互联网公开数据 标签:社交媒体,公共群组,帖子,评论,匿名化,情感分析,用户互动,文本数据 数据概述:...
    packageimg
  • Phoronix科技新闻文章标题与内容数据集

    2025年4月15日   

    Phoronix科技新闻文章标题与内容数据集 数据来源:互联网公开数据 标签:科技新闻,NLP,文本分析,自然语言处理,新闻文章,Phoronix,文章标题,文本数据,数据挖掘 数据概述:...
    packageimg
  • 英国广播公司BBC新闻文章文本数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
    packageimg
  • 谷歌应用商店App评论情感分析数据集-时间不限

    2025年4月15日   

    谷歌应用商店App评论情感分析数据集-时间不限 数据来源:互联网公开数据 标签:谷歌应用商店,App评论,情感分析,用户反馈,文本数据,自然语言处理,移动应用,数据挖掘 数据概述: 本数据集包含了从谷歌应用商店抓取并清洗后的App数据和评论信息。 数据集涵盖了大量App的详细信息以及用户对其的评价内容,为进行情感分析提供了丰富的数据基础。...
    packageimg