-
Sber银行问答数据集SberQADataset-theerror
Sber银行问答数据集SberQADataset-theerror 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,人工智能,银行服务,客户支持,信息检索 数据概述:该数据集由Sber银行提供,包含了一系列用户与银行客服之间的问答对话,适用于自然语言处理和问答系统的研究。主要特征如下:... -
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan 数据来源:互联网公开数据 标签:教育, 项目资助, 文本分析, 机器学习, 自然语言处理, 教师, 学校, 数据挖掘 数据概述:... -
亚马逊优质食品评论数据集AmazonFineFoodReviewsDataset-tohidul16182
亚马逊优质食品评论数据集AmazonFineFoodReviewsDataset-tohidul16182 数据来源:互联网公开数据 标签:食品评论,数据集,情感分析,机器学习,自然语言处理,消费者洞察,电子商务,商业分析 数据概述: 该数据集包含来自亚马逊平台的优质食品评论数据,记录了消费者对食品产品的评价和反馈。主要特征如下:... -
语音识别训练数据集Wav2Vec语音识别数据集-tsqmsds2023fastnulhr
语音识别训练数据集Wav2Vec语音识别数据集-tsqmsds2023fastnulhr 数据来源:互联网公开数据 标签:语音识别,数据集,机器学习,自然语言处理,音频处理,人工智能,语音技术,语音转文本 数据概述:该数据集包含来自多个来源的语音数据,主要用于训练语音识别模型,尤其是Wav2Vec模型。主要特征如下:... -
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:... -
书籍摘要文本分类数据集BookSummaryTextClassificationDataset-tangha2005
书籍摘要文本分类数据集BookSummaryTextClassificationDataset-tangha2005 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 书籍摘要, 文本摘要, 情感分析, 机器学习, 语料库, 多标签分类 数据概述:... -
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:... -
六月消费者评论数据集JuneConsumerReviewsDataset-tuankiet37
六月消费者评论数据集JuneConsumerReviewsDataset-tuankiet37 数据来源:互联网公开数据 标签:消费者评论,数据集,文本分析,情感分析,市场研究,自然语言处理,商业智能,用户体验 数据概述: 该数据集包含来自互联网的消费者评论数据,记录了用户对不同产品和服务的评价。主要特征如下:... -
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源:互联网公开数据 标签:文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建 数据概述:... -
有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er
有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er 数据来源:互联网公开数据 标签:文本分析,情感分析,自然语言处理,机器学习,毒性检测,评论分类,深度学习,数据竞赛 数据概述: 该数据集来自 Kaggle... -
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:... -
餐饮评论分析数据集Yelp本地生活服务Dataset-tisage
餐饮评论分析数据集Yelp本地生活服务Dataset-tisage 数据来源:互联网公开数据 标签:餐饮评论,数据集,自然语言处理,用户反馈,机器学习,商业分析,市场研究,用户体验 数据概述: 该数据集来自 Yelp 网站,主要记录了餐饮行业的用户评论数据,适用于评论分析、情感分析等任务。主要特征如下:... -
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。... -
内容优化平台用户行为数据集-terrychanorg
内容优化平台用户行为数据集-terrychanorg 数据来源:互联网公开数据 标签:用户行为,内容推荐,点击率预测,机器学习,自然语言处理,数据分析,广告推荐,个性化 数据概述: 该数据集包含来自内容优化平台的用户行为数据,记录了用户与平台内容的交互情况。主要特征如下: 时间跨度:数据记录的时间范围为2023年至今。... -
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher 数据来源:互联网公开数据 标签:文本情感分析, 交通出行, 语料库, 情感分类, 机器学习, 自然语言处理, 交通政策, 环境保护 数据概述:... -
法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011
法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,机器学习,自然语言处理,人工智能,案例分析,裁判文书 数据概述: 该数据集包含来自中国各级法院的法律案例裁判文书数据,记录了各类案件的详细信息。主要特征如下:... -
ICliniq医疗健康咨询数据集ICliniqMedicalHealthConsultationDataset-thuntrngbnh
ICliniq医疗健康咨询数据集ICliniqMedicalHealthConsultationDataset-thuntrngbnh 数据来源:互联网公开数据 标签:医疗健康,数据集,咨询记录,数据分析,临床研究,人工智能,自然语言处理,电子病历 数据概述:... -
越南语句情感分析数据集-taitruong256
越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。... -
临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda
临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda 数据来源:互联网公开数据 标签:医疗健康,电子病历,三元组,深度学习,自然语言处理,文本挖掘,医学研究,知识图谱 数据概述: 该数据集包含用于训练临床电子病历(Electronic Health Record,...