找到937个数据集

标签: 文本数据

过滤结果
  • 波兰图书评论数据集

    2025年4月15日   

    波兰图书评论数据集 数据来源:互联网公开数据 标签:图书评论,波兰,用户反馈,情感分析,文本数据,自然语言处理 数据概述: 本数据集来源于波兰最大的在线图书论坛...
    packageimg
  • YouTube热门视频高赞评论数据集

    2025年4月15日   

    YouTube热门视频高赞评论数据集 数据来源:互联网公开数据 标签:YouTube,评论,高赞,社交媒体,文本数据,自然语言处理,情感分析,视频,观看量,用户互动 数据概述: 本数据集包含YouTube上观看量超过10亿次的视频的精选高赞评论。数据基于YouTube...
    packageimg
  • 艾哈迈德故事集-杰玛2-2B数据集

    2025年4月15日   

    艾哈迈德故事集-杰玛2-2B数据集 数据来源:互联网公开数据 标签:古典阿拉伯故事,指令响应格式,故事集,阿拉伯文化,文本数据,语言学习,文化研究 数据概述: 本数据集收录了以指令/响应格式呈现的古典阿拉伯故事,涵盖了从网络多个来源收集和生成的故事内容。数据集为研究阿拉伯古典文学、语言学习以及文化传承提供了宝贵资源。 数据用途概述:...
    packageimg
  • eBay商品评论情感分析数据集

    2025年4月15日   

    eBay商品评论情感分析数据集 数据来源:互联网公开数据 标签:eBay,商品评论,情感分析,文本数据,评分,机器学习,自然语言处理 数据概述: 本数据集由作者通过Python网络爬虫脚本从eBay网站抓取,旨在用于情感分析模型的构建。数据集包含两个文件:...
    packageimg
  • Reddit关系建议社区用户互动与关系动态数据集

    2025年4月15日   

    Reddit关系建议社区用户互动与关系动态数据集 数据来源:互联网公开数据 标签:Reddit,关系建议,社交媒体,用户行为,情感分析,人际关系,社区,文本数据 数据概述:...
    packageimg
  • 网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用

    2025年4月15日   

    网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-...
    packageimg
  • 推特用户评论情感分析数据集

    2025年4月15日   

    推特用户评论情感分析数据集 数据来源:互联网公开数据 标签:推特,用户评论,情感分析,文本数据,自然语言处理,情感分类,客户反馈 数据概述: 本数据集包含数千条推特用户评论(输入文本)及其对应的情感标签(输出标签),旨在用于情感分析模型的训练。数据通过使用关键词从Twitter...
    packageimg
  • 谷歌应用商店用户评论情感分析数据集

    2025年4月15日   

    谷歌应用商店用户评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析,用户评论,应用商店,文本数据,自然语言处理,情感极性,评论分析,机器学习 数据概述:...
    packageimg
  • 巴西疫情调查委员会听证会发言记录数据集-2021年

    2025年4月15日   

    巴西疫情调查委员会听证会发言记录数据集-2021年 数据来源:互联网公开数据 标签:巴西,疫情,调查委员会,CPI,听证会,政治,数据分析,文本数据 数据概述: 本数据集收录了巴西疫情调查委员会(CPI da...
    packageimg
  • Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年

    2025年4月15日   

    Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年 数据来源:互联网公开数据 标签:Netflix,社交媒体,Facebook,用户评论,情感分析,LLM,自然语言处理,文本数据 数据概述:...
    packageimg
  • 情感检测CNN输出数据集

    2025年4月15日   

    情感检测CNN输出数据集 数据来源:互联网公开数据 标签:情感检测,CNN,机器学习,深度学习,准确率,情绪分析,文本数据 数据概述:...
    packageimg
  • 开放域问答数据集-问题与答案-2023年

    2025年4月15日   

    开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question...
    packageimg
  • Kaggle文本数据竞赛优胜方案分析数据集-2021-2023

    2025年4月15日   

    Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。...
    packageimg
  • TripAdvisor酒店评论情感分析数据集-2万条评论

    2025年4月15日   

    TripAdvisor酒店评论情感分析数据集-2万条评论 数据来源:互联网公开数据 标签:酒店评论,情感分析,TripAdvisor,用户评价,文本数据,情感评分,旅游,大数据 数据概述:...
    packageimg
  • ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日

    2025年4月15日   

    ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日 数据来源:互联网公开数据 标签:推文,社交媒体,Twitter,ChatGPT,GPT3,GPT4,自然语言处理,情感分析,数据分析,文本数据 数据概述:...
    packageimg
  • Reddit评论情感倾向与冒犯性评分数据集

    2025年4月15日   

    Reddit评论情感倾向与冒犯性评分数据集 数据来源:互联网公开数据 标签:Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据 数据概述:...
    packageimg
  • 洋葱新闻讽刺文章数据集

    2025年4月15日   

    洋葱新闻讽刺文章数据集 数据来源:互联网公开数据 标签:讽刺新闻,洋葱,媒体分析,文本数据,图像数据,新闻趋势,幽默文化 数据概述: 本数据集收录了来自《洋葱》(The...
    packageimg
  • 权力的游戏全季剧本数据集

    2025年4月15日   

    权力的游戏全季剧本数据集 数据来源:互联网公开数据 标签:权力的游戏, 剧本, 季节, 对话分析, 文本挖掘, 文本数据, 剧情研究 数据概述: 本数据集收录了《权力的游戏》(Game of...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • 手机评论数据集

    2025年4月15日   

    手机评论数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,文本数据,评分系统,自然语言处理,数据清洗,机器学习 数据概述: 本数据集包含手机评论的原始数据,覆盖了从旧款到新款手机的用户反馈,每条评论均配有1到5星的评分。数据集以原始形式呈现,包含缺失值、异常值以及重复数据。这些原始数据为后续的数据处理和分析提供了基础。 数据用途概述:...
    packageimg