找到11,824个数据集

标签: 自然语言处理

过滤结果
  • Sber银行问答数据集SberQADataset-theerror

    2025年5月29日   

    Sber银行问答数据集SberQADataset-theerror 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,人工智能,银行服务,客户支持,信息检索 数据概述:该数据集由Sber银行提供,包含了一系列用户与银行客服之间的问答对话,适用于自然语言处理和问答系统的研究。主要特征如下:...
    packageimg
  • 教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan

    2025年5月29日   

    教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan 数据来源:互联网公开数据 标签:教育, 项目资助, 文本分析, 机器学习, 自然语言处理, 教师, 学校, 数据挖掘 数据概述:...
    packageimg
  • 亚马逊优质食品评论数据集AmazonFineFoodReviewsDataset-tohidul16182

    2025年5月29日   

    亚马逊优质食品评论数据集AmazonFineFoodReviewsDataset-tohidul16182 数据来源:互联网公开数据 标签:食品评论,数据集,情感分析,机器学习,自然语言处理,消费者洞察,电子商务,商业分析 数据概述: 该数据集包含来自亚马逊平台的优质食品评论数据,记录了消费者对食品产品的评价和反馈。主要特征如下:...
    packageimg
  • 语音识别训练数据集Wav2Vec语音识别数据集-tsqmsds2023fastnulhr

    2025年5月29日   

    语音识别训练数据集Wav2Vec语音识别数据集-tsqmsds2023fastnulhr 数据来源:互联网公开数据 标签:语音识别,数据集,机器学习,自然语言处理,音频处理,人工智能,语音技术,语音转文本 数据概述:该数据集包含来自多个来源的语音数据,主要用于训练语音识别模型,尤其是Wav2Vec模型。主要特征如下:...
    packageimg
  • 音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan

    2025年5月29日   

    音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:...
    packageimg
  • 书籍摘要文本分类数据集BookSummaryTextClassificationDataset-tangha2005

    2025年5月29日   

    书籍摘要文本分类数据集BookSummaryTextClassificationDataset-tangha2005 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 书籍摘要, 文本摘要, 情感分析, 机器学习, 语料库, 多标签分类 数据概述:...
    packageimg
  • 维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus

    2025年5月29日   

    维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:...
    packageimg
  • 六月消费者评论数据集JuneConsumerReviewsDataset-tuankiet37

    2025年5月29日   

    六月消费者评论数据集JuneConsumerReviewsDataset-tuankiet37 数据来源:互联网公开数据 标签:消费者评论,数据集,文本分析,情感分析,市场研究,自然语言处理,商业智能,用户体验 数据概述: 该数据集包含来自互联网的消费者评论数据,记录了用户对不同产品和服务的评价。主要特征如下:...
    packageimg
  • 指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban

    2025年5月29日   

    指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源:互联网公开数据 标签:文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建 数据概述:...
    packageimg
  • 有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er

    2025年5月29日   

    有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er 数据来源:互联网公开数据 标签:文本分析,情感分析,自然语言处理,机器学习,毒性检测,评论分类,深度学习,数据竞赛 数据概述: 该数据集来自 Kaggle...
    packageimg
  • 英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn

    2025年5月29日   

    英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:...
    packageimg
  • 餐饮评论分析数据集Yelp本地生活服务Dataset-tisage

    2025年5月29日   

    餐饮评论分析数据集Yelp本地生活服务Dataset-tisage 数据来源:互联网公开数据 标签:餐饮评论,数据集,自然语言处理,用户反馈,机器学习,商业分析,市场研究,用户体验 数据概述: 该数据集来自 Yelp 网站,主要记录了餐饮行业的用户评论数据,适用于评论分析、情感分析等任务。主要特征如下:...
    packageimg
  • 社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab

    2025年5月29日   

    社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。...
    packageimg
  • 内容优化平台用户行为数据集-terrychanorg

    2025年5月29日   

    内容优化平台用户行为数据集-terrychanorg 数据来源:互联网公开数据 标签:用户行为,内容推荐,点击率预测,机器学习,自然语言处理,数据分析,广告推荐,个性化 数据概述: 该数据集包含来自内容优化平台的用户行为数据,记录了用户与平台内容的交互情况。主要特征如下: 时间跨度:数据记录的时间范围为2023年至今。...
    packageimg
  • 新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg

    2025年5月28日   

    新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:...
    packageimg
  • 交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher

    2025年5月28日   

    交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher 数据来源:互联网公开数据 标签:文本情感分析, 交通出行, 语料库, 情感分类, 机器学习, 自然语言处理, 交通政策, 环境保护 数据概述:...
    packageimg
  • 法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011

    2025年5月28日   

    法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,机器学习,自然语言处理,人工智能,案例分析,裁判文书 数据概述: 该数据集包含来自中国各级法院的法律案例裁判文书数据,记录了各类案件的详细信息。主要特征如下:...
    packageimg
  • ICliniq医疗健康咨询数据集ICliniqMedicalHealthConsultationDataset-thuntrngbnh

    2025年5月28日   

    ICliniq医疗健康咨询数据集ICliniqMedicalHealthConsultationDataset-thuntrngbnh 数据来源:互联网公开数据 标签:医疗健康,数据集,咨询记录,数据分析,临床研究,人工智能,自然语言处理,电子病历 数据概述:...
    packageimg
  • 越南语句情感分析数据集-taitruong256

    2025年5月28日   

    越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。...
    packageimg
  • 临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda

    2025年5月28日   

    临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda 数据来源:互联网公开数据 标签:医疗健康,电子病历,三元组,深度学习,自然语言处理,文本挖掘,医学研究,知识图谱 数据概述: 该数据集包含用于训练临床电子病历(Electronic Health Record,...
    packageimg