找到11,756个数据集

标签: 自然语言处理

过滤结果
  • 英语-法语翻译数据集

    2025年4月15日   

    英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 七十士译本数据集

    2025年4月15日   

    七十士译本数据集 数据来源:互联网公开数据 标签:七十士译本,旧约圣经,希伯来文,希腊文,圣经翻译,NLP,自然语言处理,文本分析 数据概述:...
    packageimg
  • 印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月

    2025年4月15日   

    印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月 数据来源:互联网公开数据 标签:印尼新闻,头条,DetikNews,新闻分析,自然语言处理,媒体研究,时间序列,印尼语 数据概述:...
    packageimg
  • 符号相关性数据集用于LLM

    2025年4月15日   

    符号相关性数据集用于LLM 数据来源:互联网公开数据 标签:LLM,符号相关性,知识语言关系,自然语言处理,机器学习,研究数据 数据概述:...
    packageimg
  • 矛盾侦探瓦森翻译数据集

    2025年4月15日   

    矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear...
    packageimg
  • 预处理抑郁数据集

    2025年4月15日   

    预处理抑郁数据集 数据来源:互联网公开数据 标签:抑郁症,心理健康,文本分析,情感分析,社交媒体,自然语言处理,情感状态 数据概述:...
    packageimg
  • 英语时态分类数据集

    2025年4月15日   

    英语时态分类数据集 数据来源:互联网公开数据 标签:英语时态,自然语言处理,机器学习,句子分类,语法分析 数据概述: 本数据集包含标注了相应时态类别的英文句子,适用于自然语言处理(NLP)和机器学习项目中的时态分类任务。每个条目包括一个句子及其对应的时态数值标签,覆盖了多种时态类型,为研究和开发提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • LLM科学考试数据集-多样化数据源整合-竞赛专用

    2025年4月15日   

    LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6...
    packageimg
  • WordNet反义词数据集-2006

    2025年4月15日   

    WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"...
    packageimg
  • 谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类

    2025年4月15日   

    谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,评论数据,谷歌应用商店,二分类,多分类 数据概述: 本数据集包含两个文件:gpreviews_2.csv 和...
    packageimg
  • Gustavosta自然语言处理研究提示数据集-2023

    2025年4月15日   

    Gustavosta自然语言处理研究提示数据集-2023 数据来源:互联网公开数据 标签:NLP,提示,自然语言处理,研究资源,Huggingface,机器学习,数据集 数据概述: 本数据集由Huggingface Hub提供,包含从Stable...
    packageimg
  • 土耳其民歌歌词数据集

    2025年4月15日   

    土耳其民歌歌词数据集 数据来源:互联网公开数据 标签:土耳其民歌,歌词,文化研究,情感分析,NLP,自然语言处理,地域分析 数据概述:...
    packageimg
  • 问题-答案-代码解决方案-带编号数据集适用于AIMO

    2025年4月15日   

    问题-答案-代码解决方案-带编号数据集适用于AIMO 数据来源:互联网公开数据 标签:问题答案,代码解决方案,AIMO,数学问题,教育数据,编程教育,自然语言处理 数据概述:...
    packageimg
  • 西班牙语-英语翻译语料库数据集

    2025年4月15日   

    西班牙语-英语翻译语料库数据集 数据来源:互联网公开数据 标签:西班牙语,英语,翻译,机器翻译,语言模型,自然语言处理,跨语言文本 数据概述:...
    packageimg
  • 土耳其谚语与俗语数据集

    2025年4月15日   

    土耳其谚语与俗语数据集 数据来源:互联网公开数据 标签:谚语,俗语,土耳其语言,自然语言处理,NLP,文化研究,文本分析 数据概述:...
    packageimg
  • 孟加拉语-英语-印地语混合语言侮辱性语言识别数据集

    2025年4月15日   

    孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:...
    packageimg
  • 印度情绪分析社交媒体数据集2023

    2025年4月15日   

    印度情绪分析社交媒体数据集2023 数据来源:互联网公开数据 标签:情绪分析,社交媒体,推特,英语,情感分类,数据标注,自然语言处理 数据概述: 本数据集包含通过Twitter...
    packageimg
  • 巴西葡萄牙语冒犯性语言识别数据集

    2025年4月15日   

    巴西葡萄牙语冒犯性语言识别数据集 数据来源:互联网公开数据 标签:冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全 数据概述:...
    packageimg
  • 自然语言处理研究人员网络数据集

    2025年4月15日   

    自然语言处理研究人员网络数据集 数据来源:互联网公开数据 标签:自然语言处理,研究人员,学术论文,作者网络,研究领域,机构信息 数据概述:...
    packageimg