-
法语电影评论及英译数据集
法语电影评论及英译数据集 数据来源:互联网公开数据 标签:电影评论,法语,情感分析,翻译,自然语言处理,文本数据,电影产业 数据概述: 本数据集包含从法国知名电影网站Allociné收集的法语电影评论及其英文翻译版本。原始数据由Théophile... -
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:... -
在线学校情感分析数据集Sentiment-Sekolah-OnlineDataset-agielasyari1
在线学校情感分析数据集Sentiment-Sekolah-OnlineDataset-agielasyari1 数据来源:互联网公开数据 标签:情感分析,在线教育,数据集,自然语言处理,文本挖掘,机器学习,教育技术,用户反馈 数据概述: 该数据集包含来自在线学校平台的用户评论和反馈数据,记录了学生对课程,教师和平台的情感态度。主要特征如下:... -
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna 数据来源:互联网公开数据 标签:社会偏见,数据集,文本分析,自然语言处理,机器学习,社会研究,伦理研究,偏见检测 数据概述: 该数据集来自Crows... -
问答数据集涵盖广泛主题的高质量问答内容
标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据... -
意图分类数据集IntentClassificationDataset-sukuujodd
意图分类数据集IntentClassificationDataset-sukuujodd 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,文本分类,智能客服,语音助手,人工智能 数据概述: 该数据集包含来自公开来源的文本数据,记录了用户输入的文本及其对应的意图标签。主要特征如下: 时间跨度:数据记录的时间范围从近年至今。... -
新闻深度处理数据集NewsDeepProcessedDataset-mario123475
新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:... -
网络语言脏话数据集SwearTotalData-parkgarden
网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye 数据来源:互联网公开数据 标签:邮政编码,数据生成,自然语言处理,人工智能,机器学习,数据集,文本生成,智能编码 数据概述:... -
多领域问答数据集-包含4万条带上下文信息的数据集
多领域问答数据集-包含4万条带上下文信息的数据集 数据来源:互联网公开数据 标签:问答,上下文,多领域,文本数据,自然语言处理,机器学习,数据清洗,数据预处理 数据概述:... -
医学出版物医学健康数据集PMC-SMedicalHealthcareDataset-huzzefakhan
医学出版物医学健康数据集PMC-SMedicalHealthcareDataset-huzzefakhan 数据来源:互联网公开数据 标签:医学,医疗保健,数据集,出版物,文本挖掘,自然语言处理,生物医学,临床研究 数据概述: 该数据集收录了来自PubMed Central (PMC)... -
情感分析社交媒体数据集SentimentOutData20220929-darioceni
情感分析社交媒体数据集SentimentOutData20220929-darioceni 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分析,自然语言处理,机器学习,社会研究,市场分析 数据概述:... -
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:... -
汉越词到现代越语诗歌翻译数据集Hanviet2ModernvietPoemTranslationDataset-anhnguyenquoc
汉越词到现代越语诗歌翻译数据集Hanviet2ModernvietPoemTranslationDataset-anhnguyenquoc 数据来源:互联网公开数据 标签:语言翻译,诗歌,越南语,数据集,自然语言处理,机器学习,文学研究,文化研究 数据概述:... -
仇恨言论训练数据集HateTrain1Dataset-miguelbanda
仇恨言论训练数据集HateTrain1Dataset-miguelbanda 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,社会研究,伦理研究 数据概述:该数据集来自互联网公开的社交媒体平台,记录了用户的评论和帖子内容,主要用于识别和分析仇恨言论。主要特征如下:... -
推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000
推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000 数据来源:互联网公开数据 标签:文本分析,关键词提取,数据集,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自推特平台的文本数据,记录了推文内容的特征及其关键词提取结果。主要特征如下:... -
电影评论情感分析数据集BagofWordsMeetsBagsofPopcornDataset-onkarsuryavanshi23
电影评论情感分析数据集BagofWordsMeetsBagsofPopcornDataset-onkarsuryavanshi23 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,机器学习,自然语言处理,情感识别,影评分析,数据科学 数据概述: 该数据集包含来自电影评论网站的数据,记录了用户对电影的评价文本及其对应的情感标签。主要特征如下:... -
特朗普推文数据集DJTrumpTweetsDataset-lpdataninja
特朗普推文数据集DJTrumpTweetsDataset-lpdataninja 数据来源:互联网公开数据 标签:社交媒体,推文分析,政治研究,文本挖掘,自然语言处理,机器学习,数据集,舆论分析 数据概述: 该数据集包含来自前美国总统唐纳德·特朗普(Donald J.... -
中文翻译数据集SQUADTranslatedtoHindiDataset-ramisaalam
中文翻译数据集SQUADTranslatedtoHindiDataset-ramisaalam 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,文本分类,人工智能,中文翻译,Hindi 数据概述: 该数据集包含来自SQUAD数据集的中文翻译数据,记录了原始英文问答对及其对应的中文翻译。主要特征如下:... -
英语到印地语翻译数据集English-to-HindiTranslationDataset-pratyushojha12
英语到印地语翻译数据集English-to-HindiTranslationDataset-pratyushojha12 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,翻译研究,语言技术,双语数据 数据概述: 该数据集包含来自多个公开来源的英语到印地语的平行语料,记录了双语对照的句子对。主要特征如下:...