找到940个数据集

标签: 文本数据

过滤结果
  • ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日

    2025年4月15日   

    ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日 数据来源:互联网公开数据 标签:推文,社交媒体,Twitter,ChatGPT,GPT3,GPT4,自然语言处理,情感分析,数据分析,文本数据 数据概述:...
    packageimg
  • Reddit评论情感倾向与冒犯性评分数据集

    2025年4月15日   

    Reddit评论情感倾向与冒犯性评分数据集 数据来源:互联网公开数据 标签:Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据 数据概述:...
    packageimg
  • 洋葱新闻讽刺文章数据集

    2025年4月15日   

    洋葱新闻讽刺文章数据集 数据来源:互联网公开数据 标签:讽刺新闻,洋葱,媒体分析,文本数据,图像数据,新闻趋势,幽默文化 数据概述: 本数据集收录了来自《洋葱》(The...
    packageimg
  • 权力的游戏全季剧本数据集

    2025年4月15日   

    权力的游戏全季剧本数据集 数据来源:互联网公开数据 标签:权力的游戏, 剧本, 季节, 对话分析, 文本挖掘, 文本数据, 剧情研究 数据概述: 本数据集收录了《权力的游戏》(Game of...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • 手机评论数据集

    2025年4月15日   

    手机评论数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,文本数据,评分系统,自然语言处理,数据清洗,机器学习 数据概述: 本数据集包含手机评论的原始数据,覆盖了从旧款到新款手机的用户反馈,每条评论均配有1到5星的评分。数据集以原始形式呈现,包含缺失值、异常值以及重复数据。这些原始数据为后续的数据处理和分析提供了基础。 数据用途概述:...
    packageimg
  • Flipkart手机用户评论情感分析数据集

    2025年4月15日   

    Flipkart手机用户评论情感分析数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,用户反馈,电商,文本数据,自然语言处理,产品评价 数据概述: 本数据集包含了来自 Flipkart...
    packageimg
  • 阿拉伯语故事生成数据集

    2025年4月15日   

    阿拉伯语故事生成数据集 数据来源:互联网公开数据 标签:MSA,叙事生成,阿拉伯语故事,故事生成,文本数据,自然语言处理,机器学习,故事创作 数据来源: 本数据集由不列颠哥伦比亚大学自然语言处理小组(UBC-NLP)整理发布,详细信息可参考其GitHub仓库:https://github.com/UBC-NLP/arastories.git。作者包括...
    packageimg
  • 多语言平行语料库释义数据集-73种语言

    2025年4月15日   

    多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves...
    packageimg
  • 印尼语评论情感分析数据集SERFEE

    2025年4月15日   

    印尼语评论情感分析数据集SERFEE 数据来源:互联网公开数据 标签:情感分析,印尼语,文本数据,机器学习,自然语言处理,评论,情感分类 数据概述: 本数据集专为印尼语情感分析任务设计,通过整合“indonlu”和“google-play-...
    packageimg
  • Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题

    2025年4月15日   

    Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱 数据概述:...
    packageimg
  • 林肯公园YouTube视频评论情感分析数据集

    2025年4月15日   

    林肯公园YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:林肯公园,YouTube,视频,评论,情感分析,自然语言处理,用户反馈,音乐,社交媒体,文本数据 数据概述: 本数据集包含两部分数据,分别关于YouTube上林肯公园(Linkin...
    packageimg
  • 莎士比亚十四行诗菲律宾语翻译数据集

    2025年4月15日   

    莎士比亚十四行诗菲律宾语翻译数据集 数据来源:互联网公开数据 标签:莎士比亚,十四行诗,翻译,菲律宾语,Tagalog,文本数据,文学,语言学 数据概述: 本数据集包含威廉·莎士比亚十四行诗的ASCII文本,总共有超过2,450行。原文本从Andrej Karpathy的GitHub仓库minGPT复制而来。随后,我们使用ChatGPT...
    packageimg
  • 猫途鹰酒店评论情感分析数据集

    2025年4月15日   

    猫途鹰酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,语义分析,用户评价,文本数据,旅游,消费者行为,自然语言处理 数据概述:...
    packageimg
  • YouTube-Twitter和短信垃圾信息数据集

    2025年4月15日   

    YouTube-Twitter和短信垃圾信息数据集 数据来源:互联网公开数据 标签:垃圾信息,短信,社交媒体,YouTube,Twitter,文本数据,自然语言处理,垃圾邮件检测 数据概述: 本数据集整合了多个公开的垃圾信息数据集,旨在为垃圾信息检测、文本分类等研究提供数据资源。数据集主要由三部分组成:...
    packageimg
  • 银行客户推文情感分析数据集

    2025年4月15日   

    银行客户推文情感分析数据集 数据来源:互联网公开数据 标签:银行,客户,推文,情感分析,尼日利亚,社交媒体,文本数据,自然语言处理 数据概述:...
    packageimg
  • 亚马逊电子产品评论情感分析数据集

    2025年4月15日   

    亚马逊电子产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,电子产品,评论,情感分析,消费者行为,文本数据,机器学习,自然语言处理 数据概述: 本数据集包含约3000条来自亚马逊电子产品部门的约200个产品的产品评论,旨在用于深入理解亚马逊平台上产品的用户情感。数据集包含了用户对产品的文字评价,为情感分析提供了基础。...
    packageimg
  • 多轮对话提示数据集

    2025年4月15日   

    多轮对话提示数据集 数据来源:互联网公开数据 标签:多轮对话,文本数据,自然语言处理,机器学习,对话系统,数据标注,人工智能聊天机器人 数据概述:...
    packageimg
  • 莎士比亚作品词汇数据集

    2025年4月15日   

    莎士比亚作品词汇数据集 数据来源:互联网公开数据 标签:莎士比亚, 文学, 词汇分析, 文本数据, 语言学研究, Google BigQuery, 开源数据 数据概述: 本数据集来源于Google BigQuery的公开数据集bigquery-public-...
    packageimg
  • 英国广播公司BBC新闻文章文本分类数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:...
    packageimg