找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 词汇语义与修辞手法数据集-词汇同义词与词频统计

    2025年4月14日   

    词汇语义与修辞手法数据集-词汇同义词与词频统计 数据来源:互联网公开数据 标签:词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库 数据概述:...
    packageimg
  • 开放LLM性能数据集

    2025年4月14日   

    开放LLM性能数据集 数据来源:互联网公开数据 标签:开放语言模型,性能基准,Hugging Face,自然语言处理,机器学习,评估指标 数据概述: 本数据集是基于Hugging Face排行榜截至2023年10月16日的全面语言模型性能评估指标。数据集收录了多种开放语言模型的性能数据,涵盖多个评估维度,为研究和比较不同语言模型提供了可靠的数据基础。...
    packageimg
  • 多语言有毒言论检测数据集2023

    2025年4月14日   

    多语言有毒言论检测数据集2023 数据来源:互联网公开数据 标签:有毒言论,社交媒体,自然语言处理,多语言,文本分类,情感分析,言论监测 数据概述: 本数据集收录了用法语、英语和阿拉伯语标注的推文,每条推文被标记为有毒或非有毒。数据集中,标签0表示非有毒推文,标签1表示有毒推文。该数据集为研究多语言环境下的有毒言论提供了丰富的资源。 数据用途概述:...
    packageimg
  • 纳斯达克新闻情感分析数据集

    2025年4月14日   

    纳斯达克新闻情感分析数据集 数据来源:互联网公开数据 标签:纳斯达克,新闻,情感分析,金融,市场趋势,投资决策,自然语言处理 数据概述: 本数据集来源于雅虎财经和商业内幕网(市场内幕网),收录了纳斯达克市场上热门股票的新闻报道,并通过Hugging Face的FinBERT...
    packageimg
  • 亚马逊精选美食评论数据集

    2025年4月14日   

    亚马逊精选美食评论数据集 数据来源:互联网公开数据 标签:电子商务,食品,用户评价,自然语言处理,NLP,推荐系统,评分数据,消费行为 数据概述 本数据集是经过精简和清洗的 Amazon Fine Foods...
    packageimg
  • 巴基斯坦用户对Threads推特应用评论情感分析数据集

    2025年4月14日   

    巴基斯坦用户对Threads推特应用评论情感分析数据集 数据来源:互联网公开数据 标签:社交媒体,评论分析,用户反馈,情感分析,Threads,巴基斯坦,应用评估,自然语言处理 数据概述: 本数据集包含了来自巴基斯坦地区用户在Google...
    packageimg
  • 多语言灾害响应消息数据集

    2025年4月14日   

    多语言灾害响应消息数据集 数据来源:互联网公开数据 标签:灾害响应,多语言,消息分类,自然语言处理,文本分析,紧急救援,机器学习 数据概述:...
    packageimg
  • 英国HR岗位数据集

    2025年4月14日   

    英国HR岗位数据集 数据来源:互联网公开数据 标签:HR岗位,英国,招聘数据,数据清洗,自然语言处理,命名实体识别,技能提取 数据概述:...
    packageimg
  • 乌兹别克斯坦宪法NLP数据集

    2025年4月14日   

    乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...
    packageimg
  • RAG与Few-Shot相似问题提示数据集

    2025年4月14日   

    RAG与Few-Shot相似问题提示数据集 数据来源:互联网公开数据 标签:相似问题,嵌入向量,提示生成,RAG,Few Shot学习,自然语言处理,NLP 数据概述:...
    packageimg
  • 英语单词家族数据集1963-2021

    2025年4月14日   

    英语单词家族数据集1963-2021 数据来源:互联网公开数据 标签:英语单词,词典,自然语言处理,NLP,词汇学,教育培训 数据概述: 本数据集收录了按字母顺序排列的全部英语单词,涵盖了从A到Z的所有单词条目。数据集适用于自然语言处理项目的参考和验证,为词典编纂、词汇学研究和教育培训提供了全面的单词资源。 数据用途概述:...
    packageimg
  • 烂番茄电影评论情感分析数据集

    2025年4月14日   

    烂番茄电影评论情感分析数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,情感极性,烂番茄,评论数据 数据概述: 本数据集是一个情感分类数据集,包含了来自烂番茄电影评论的5331条正面评价和5331条负面评价,共计10662条评论。这些评论都经过了预处理,平均每条评论包含21个单词。该数据集常被用作文本分类任务的基准。...
    packageimg
  • 巴西电商平台商品评价数据分析数据集-亚马逊与MercadoLivre-葡萄牙语-用户评价

    2025年4月14日   

    巴西电商平台商品评价数据分析数据集-亚马逊与MercadoLivre-葡萄牙语-用户评价 数据来源:互联网公开数据 标签:电商,用户评价,商品评论,亚马逊,Mercado Livre,葡萄牙语,情感分析,自然语言处理,数据挖掘 数据概述: 本数据集包含了从巴西电商平台亚马逊(Amazon)和Mercado...
    packageimg
  • YouTube热门视频标题与描述分类数据集

    2025年4月14日   

    YouTube热门视频标题与描述分类数据集 数据来源:互联网公开数据 标签:YouTube,视频,热门,趋势,分类,标题,描述,自然语言处理,机器学习 数据概述: 本数据集收录了YouTube平台上热门视频的标题、视频链接、所属类别和视频描述信息。数据来源于YouTube平台,通过API和网络爬虫技术(Selenium,...
    packageimg
  • 产品属性提取任务数据集

    2025年4月14日   

    产品属性提取任务数据集 数据来源:互联网公开数据 标签:产品属性提取,自然语言处理,机器学习,电子商务,产品推荐,属性值对,文本分析 数据概述:...
    packageimg
  • 印度语言新闻摘要数据集

    2025年4月14日   

    印度语言新闻摘要数据集 数据来源:互联网公开数据 标签:印度语言,新闻摘要,多语言处理,自然语言处理,文本摘要,跨语言信息处理,新闻文章 数据概述:...
    packageimg
  • 婚介推荐数据集

    2025年4月14日   

    婚介推荐数据集 数据来源:互联网公开数据 标签:婚介,推荐系统,用户匹配,约会应用,数据集,机器学习,自然语言处理 数据概述:...
    packageimg
  • 神经信息处理系统大会论文数据集-NeurIPS2020

    2025年4月14日   

    神经信息处理系统大会论文数据集-NeurIPS2020 数据来源:互联网公开数据 标签:机器学习,人工智能,会议论文,学术研究,自然语言处理,计算机视觉,神经网络,NeurIPS 数据概述:...
    packageimg
  • 海得拉巴旅游景点评论数据集

    2025年4月14日   

    海得拉巴旅游景点评论数据集 数据来源:互联网公开数据 标签:旅游评论,海得拉巴,情感分析,自然语言处理,景点推荐,旅游趋势,游客满意度 数据概述:...
    packageimg
  • 印度STD药物治疗效果及患者反馈分析数据集2021

    2025年4月14日   

    印度STD药物治疗效果及患者反馈分析数据集2021 数据来源:互联网公开数据 标签:STD药物,患者反馈,治疗效果,自然语言处理,机器学习,健康研究,药物分析 数据概述:...
    packageimg