找到553个数据集

标签: NLP

过滤结果
  • 库尔德语假新闻数据集

    2025年4月14日   

    库尔德语假新闻数据集 数据来源:互联网公开数据 标签:假新闻检测,库尔德语,NLP,文本分类,新闻真实性,社交媒体内容,数据集 数据概述:...
    packageimg
  • 世界英语圣经公会议版数据集

    2025年4月14日   

    世界英语圣经公会议版数据集 数据来源:互联网公开数据 标签:世界英语圣经,公会议版,圣经,宗教,文本数据,NLP,情感分析,宗教研究 数据概述:...
    packageimg
  • 生成电子邮件垃圾邮件数据集

    2025年4月14日   

    生成电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据标注,合成数据,网络安全,文本数据,NLP,情感分析 数据概述: 本数据集包含一个CSV文件,该文件包含300条生成的电子邮件垃圾邮件消息。每个文件行代表一封单独的电子邮件,包括其标题和正文。该数据集旨在促进垃圾邮件电子邮件的分析和检测。...
    packageimg
  • 姓名与国家来源数据集

    2025年4月14日   

    姓名与国家来源数据集 数据来源:互联网公开数据 标签:姓名,国家,起源,多样性,NLP,自然语言处理,知识图谱,人名识别,文化研究,数据生成 数据概述:...
    packageimg
  • 新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月

    2025年4月14日   

    新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月 数据来源:互联网公开数据 标签:酒店评论,滨海湾金沙,TripAdvisor,用户评价,文本分析,NLP,情感分析,旅游,新加坡 数据概述:...
    packageimg
  • 阿斯利康抗新冠病毒推特数据集

    2025年4月14日   

    阿斯利康抗新冠病毒推特数据集 数据来源:互联网公开数据 标签:阿斯利康,新冠病毒,推特,情感分析,文本挖掘,NLP,社会媒体分析,公众意见 数据概述:...
    packageimg
  • Steam游戏用户评论情感分析数据集

    2025年4月14日   

    Steam游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:Steam游戏,用户评论,情感分析,推荐系统,NLP,文本挖掘,游戏评价 数据概述: 本数据集包含来自Steam平台的多个游戏的用户评论,以及用户是否推荐该游戏的标签。数据来源于AV JantaHack NLP...
    packageimg
  • 乌尔都语评论情感分类数据集

    2025年4月14日   

    乌尔都语评论情感分类数据集 数据来源:互联网公开数据 标签:乌尔都语,评论,情感分析,自然语言处理,NLP,社交媒体 数据概述:...
    packageimg
  • 自动化记者数据集

    2025年4月14日   

    自动化记者数据集 数据来源:互联网公开数据 标签:自动化记者,文本生成,NLP,新闻摘要,Reddit数据 数据概述: 本数据集来源于正在开发的自动化记者应用程序。数据包括从Reddit获取的对话记录以及由应用程序生成的新闻摘要和新闻内容。该数据集专门用于评估生成文本的质量,适用于自然语言处理(NLP)项目的评估和改进。 数据用途概述:...
    packageimg
  • Reddit问答社区用户提问数据集-AskReddit等-2023

    2025年4月14日   

    Reddit问答社区用户提问数据集-AskReddit等-2023 数据来源:互联网公开数据 标签:Reddit,问答社区,用户提问,NLP,社会研究,数据分析,用户行为 数据概述:...
    packageimg
  • 情感数据集原始版

    2025年4月14日   

    情感数据集原始版 数据来源:互联网公开数据 标签:情感分析,自然语言处理,NLP,情感检测,文本分类,机器学习,聊天机器人,推荐系统,心理健康 数据概述:...
    packageimg
  • 中东地区出行平台用户评论数据集

    2025年4月14日   

    中东地区出行平台用户评论数据集 数据来源: 互联网公开数据 (Google Play Store & Apple App Store) 标签: 用户评论,评论数据,自然语言处理,NLP,情感分析,出行平台 数据概述:...
    packageimg
  • CNBC新闻头条数据集

    2025年4月14日   

    CNBC新闻头条数据集 数据来源:互联网公开数据 标签:CNBC,新闻头条,商业,政治,金融,科技,文本挖掘,情感分析,NLP,市场研究 数据概述: 本数据集收录了500条CNBC发布的新闻头条,涵盖商业、政治、金融、科技等多个领域。数据以CSV格式组织,便于分析。新闻头条的时间跨度较大,涵盖了近期新闻周期中的重要事件。 数据用途概述:...
    packageimg
  • 亚马逊精选美食评论数据集

    2025年4月14日   

    亚马逊精选美食评论数据集 数据来源:互联网公开数据 标签:电子商务,食品,用户评价,自然语言处理,NLP,推荐系统,评分数据,消费行为 数据概述 本数据集是经过精简和清洗的 Amazon Fine Foods...
    packageimg
  • ELLIPSE英语学习者语料库

    2025年4月14日   

    ELLIPSE英语学习者语料库 数据来源:互联网公开数据 标签:英语学习者,语言能力评价,语料库,NLP,语言研究,教育评估,写作分析 数据概述:...
    packageimg
  • 乌兹别克斯坦宪法NLP数据集

    2025年4月14日   

    乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...
    packageimg
  • 斯里兰卡Singlish与僧伽罗语对话数据集

    2025年4月14日   

    斯里兰卡Singlish与僧伽罗语对话数据集 数据来源:互联网公开数据 标签:Singlish,僧伽罗语,对话数据集,NLP,聊天机器人,机器翻译,语言学习,社会媒体分析,语言研究 数据概述:...
    packageimg
  • RAG与Few-Shot相似问题提示数据集

    2025年4月14日   

    RAG与Few-Shot相似问题提示数据集 数据来源:互联网公开数据 标签:相似问题,嵌入向量,提示生成,RAG,Few Shot学习,自然语言处理,NLP 数据概述:...
    packageimg
  • 英语单词家族数据集1963-2021

    2025年4月14日   

    英语单词家族数据集1963-2021 数据来源:互联网公开数据 标签:英语单词,词典,自然语言处理,NLP,词汇学,教育培训 数据概述: 本数据集收录了按字母顺序排列的全部英语单词,涵盖了从A到Z的所有单词条目。数据集适用于自然语言处理项目的参考和验证,为词典编纂、词汇学研究和教育培训提供了全面的单词资源。 数据用途概述:...
    packageimg
  • Goodreads网站精选名言数据集

    2025年4月14日   

    Goodreads网站精选名言数据集 数据来源:互联网公开数据 标签:名言,语录,励志,格言,作者,文学,情感分析,文本生成,NLP 数据概述:...
    packageimg