找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison

    2025年6月24日   

    机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 语言模型, 文本对比, 模型评估, 自然语言处理, 文本校对, 对比分析 数据概述:...
    packageimg
  • 新闻文本情感分析数据集_News_Text_Sentiment_Analysis

    2025年6月23日   

    新闻文本情感分析数据集_News_Text_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻文本, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻文章的文本内容以及对应的情感极性标签。主要特征如下:...
    packageimg
  • 越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset

    2025年6月23日   

    越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 自然语言处理, 机器学习, 情感极性, 语料库, 深度学习 数据概述: 该数据集包含来自越南社交媒体平台的用户评论文本,用于进行情感分析。主要特征如下:...
    packageimg
  • 越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset

    2025年6月23日   

    越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 越南语, 语音数据集, 文本标注, 自然语言处理, 声学模型, 深度学习 数据概述:...
    packageimg
  • 希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset

    2025年6月23日   

    希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset 数据来源:互联网公开数据 标签:议会记录, 文本分析, 希腊, 政治, 文本挖掘, 自然语言处理, 情感分析, 政策研究 数据概述:...
    packageimg
  • 文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis

    2025年6月23日   

    文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis 数据来源:互联网公开数据 标签:性别歧视, 薪酬差距, 文本分析, 评论数据, 自然语言处理, 情感分析, 数据挖掘, 机器学习 数据概述:...
    packageimg
  • 企业邮件垃圾分类样本数据集

    2025年6月19日   

    数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容...
    packageimg
  • arXiv论文多标记语言数据集-2023年1月至2023年10月

    2025年6月4日   

    arXiv论文多标记语言数据集-2023年1月至2023年10月 数据来源:互联网公开数据 标签:arXiv,论文,多标记语言,科学研究,机器学习,自然语言处理,文本处理,学术资源 数据概述:...
    packageimg
  • COVID-19新闻数据集

    2025年6月4日   

    COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:...
    packageimg
  • 斯里兰卡手语字母数据集

    2025年6月4日   

    斯里兰卡手语字母数据集 数据来源:互联网公开数据 标签:手语识别,斯里兰卡手语,计算机视觉,图像分类,视频分析,手势识别,自然语言处理 数据概述: 本数据集包含斯里兰卡手语字母的图像和视频,涵盖了斯里兰卡手语字母表的全部符号。数据集由9位参与者提供,每位参与者单独存放在一个文件夹中。每个文件夹包含以下内容: -...
    packageimg
  • 亚马逊商品长度预测机器学习竞赛数据集-2023

    2025年6月4日   

    亚马逊商品长度预测机器学习竞赛数据集-2023 数据来源:互联网公开数据 标签:机器学习,商品长度,预测,产品尺寸,亚马逊,电商,产品目录,自然语言处理 数据概述:...
    packageimg
  • 击键日志写作过程数据集

    2025年6月4日   

    击键日志写作过程数据集 数据来源:互联网公开数据 标签:击键日志,写作过程,教育研究,人工智能,自然语言处理,写作质量,学习分析 数据概述: 本数据集记录了学习者在写作过程中产生的击键日志数据,包含关键的写作过程特征,如停顿、删除、文字爆发、过程变化等。数据集由Vanderbilt University、The Learning Agency...
    packageimg
  • 俄罗斯StackExchange数据集

    2025年6月4日   

    俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:...
    packageimg
  • 蛋白质摘要训练数据集

    2025年6月4日   

    蛋白质摘要训练数据集 数据来源:互联网公开数据 标签:蛋白质研究,生物信息学,文本摘要,训练数据,生命科学,机器学习,自然语言处理 数据概述:...
    packageimg
  • 基于希伯来语字幕预测IMDb评分的电视剧集数据集-lielbinyamin1997

    2025年6月4日   

    基于希伯来语字幕预测IMDb评分的电视剧集数据集-lielbinyamin1997 数据来源:互联网公开数据 标签:IMDb, 希伯来语字幕, 电视剧集, 评分预测, 自然语言处理, 机器学习, 情感分析, 推荐系统 数据概述:...
    packageimg
  • 语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav

    2025年6月4日   

    语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav 数据来源:互联网公开数据 标签:语音识别,呼叫中心,语音数据,ASR,性能评估,自然语言处理,声学模型,语言模型 数据概述: 本数据集“ASR Calls 2 Val”包含了从呼叫中心收集的语音数据,主要用于评估语音识别(ASR, Automatic Speech...
    packageimg
  • 自然语言处理多领域对话数据集UltraChat-200K-thedevastator

    2025年6月4日   

    自然语言处理多领域对话数据集UltraChat-200K-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,对话,生成,训练,文本,语言模型,NLG,语料库 数据概述:...
    packageimg
  • 黑客新闻文本嵌入数据集-2023-julien040

    2025年6月4日   

    黑客新闻文本嵌入数据集-2023-julien040 数据来源:互联网公开数据 标签:黑客新闻,OpenAI,文本嵌入,自然语言处理,计算机科学,创业,数据集,API 数据概述: 本数据集包含超过100,000篇来自黑客新闻(Hacker News)的帖子,黑客新闻是一个专注于计算机科学和创业的社交新闻网站。每篇帖子包含以下字段:...
    packageimg
  • 俄罗斯语音识别数据集

    2025年6月4日   

    俄罗斯语音识别数据集 数据来源:互联网公开数据 标签:语音识别,俄罗斯,ASR,STT,语音特征,自然语言处理,机器学习 数据概述:...
    packageimg
  • Jigsaw毒性评论分类无意偏见检测数据集

    2025年6月4日   

    Jigsaw毒性评论分类无意偏见检测数据集 数据来源:互联网公开数据 标签:Jigsaw,毒性评论,分类,机器学习,自然语言处理,偏见检测,数据集 数据概述: 本数据集来自Jigsaw Unintended Bias in Toxicity...
    packageimg