-
孟加拉语命名实体识别数据集-koushikdeb
孟加拉语命名实体识别数据集-koushikdeb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,孟加拉语,数据集,语言学,文本分析,机器学习,NLP 数据概述: 该数据集包含孟加拉语文本,用于命名实体识别(NER)任务。主要特征如下: 时间跨度: 数据集未明确时间范围,但涵盖了不同年代和主题的文本。 地理范围:... -
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:... -
灾难推文真假预测数据集NLPDisasterTweetsDataset-asepsaputra
灾难推文真假预测数据集NLPDisasterTweetsDataset-asepsaputra 数据来源:互联网公开数据 标签:自然语言处理,推文,灾难,预测,文本分类,机器学习,社交媒体,情感分析 数据概述: 该数据集包含来自Twitter的推文数据,旨在用于预测推文是否与真实的灾难事件相关。主要特征如下:... -
专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsData...
专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsDataset-fritzcremer 数据来源:互联网公开数据 标签:专利分析,文本挖掘,数据集,机器学习,自然语言处理,预测模型,人工智能,竞赛数据 数据概述:... -
微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329
微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329 数据来源:互联网公开数据 标签:社交媒体,立场分析,数据集,文本挖掘,自然语言处理,情感分析,机器学习,数据科学 数据概述: 该数据集包含来自微博平台的数据,记录了用户对特定话题的立场表达。主要特征如下:... -
文本评论数据分析数据集ReviewDataTextDataset-asjad2024
文本评论数据分析数据集ReviewDataTextDataset-asjad2024 数据来源:互联网公开数据 标签:文本分析,数据集,评论数据,情感分析,自然语言处理,机器学习,市场研究,消费者行为 数据概述: 该数据集包含来自互联网公开平台的文本评论数据,记录了用户对产品,服务或内容的多维度评价。主要特征如下:... -
泰国图像描述数据集ThaiCaptionDataset-blacksilva
泰国图像描述数据集ThaiCaptionDataset-blacksilva 数据来源:互联网公开数据 标签:图像描述,计算机视觉,自然语言处理,数据集,机器学习,视觉识别,多模态学习,人工智能 数据概述: 该数据集包含来自泰国地区的图像及其对应的泰文描述文本,记录了图像内容与泰文描述之间的关联。主要特征如下:... -
电子病历文本数据集EHRTextDataset-dawid9632
电子病历文本数据集EHRTextDataset-dawid9632 数据来源:互联网公开数据 标签:医疗健康,电子病历,自然语言处理,临床数据,数据集,文本挖掘,机器学习,人工智能 数据概述: 该数据集包含来自医疗机构的电子病历文本数据,记录了患者的临床信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
超大规模对话训练数据集Ultrachat训练数据集-mingky11
超大规模对话训练数据集Ultrachat训练数据集-mingky11 数据来源:互联网公开数据 标签:对话数据,自然语言处理,数据集,机器学习,人工智能,对话系统,语言模型,训练数据 数据概述:该数据集包含来自多个来源的超大规模对话数据,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。... -
问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20
问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,知识图谱,信息检索,人工智能 数据概述: 该数据集包含来自互联网的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下:... -
新闻标题预测数据集HeadlinePredictionDataset-bohraboxer
新闻标题预测数据集HeadlinePredictionDataset-bohraboxer 数据来源:互联网公开数据 标签:新闻媒体,文本分析,数据集,机器学习,自然语言处理,预测模型,信息提取,深度学习 数据概述: 该数据集记录了来自新闻媒体平台的新闻标题及相关文本数据,主要包含新闻标题,正文片段,发布时间等特征。主要特征如下:... -
心理健康治疗全程对话数据集End-to-EndMentalHealthTherapyConversationsDataset-idowuadamo
心理健康治疗全程对话数据集End-to-EndMentalHealthTherapyConversationsDataset-idowuadamo 数据来源:互联网公开数据 标签:心理健康,治疗对话,数据集,情感分析,自然语言处理,心理学,机器学习,情感计算 数据概述:... -
恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani
恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意评论,情感分析,深度学习,在线社区,文本挖掘 数据概述:... -
ChatGPT模型评估数据集ChatGPTModelEvaluationDataset-nishathmhd
ChatGPT模型评估数据集ChatGPTModelEvaluationDataset-nishathmhd 数据来源:互联网公开数据 标签:自然语言处理,模型评估,数据集,机器学习,人工智能,语言模型,对话系统,质量评估 数据概述: 该数据集包含来自ChatGPT模型的评估数据,记录了模型在不同任务中的表现和评估结果。主要特征如下:... -
合成虚拟人物对话数据集SyntheticPersonaChatDataset-kawinduwijewardhane
合成虚拟人物对话数据集SyntheticPersonaChatDataset-kawinduwijewardhane 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,聊天机器人,虚拟人物,语言模型 数据概述: 该数据集包含合成虚拟人物的对话数据,记录了不同虚拟人物之间的自然语言对话内容。主要特征如下:... -
多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd
多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd 数据来源:互联网公开数据 标签:自然语言处理,有害内容,数据集,机器学习,情感分析,文本分类,多标签分类,语言处理 数据概述:... -
Flickr8k图像与描述数据集Flickr8kImageandCaptionDataset-vinypanuwt
Flickr8k图像与描述数据集Flickr8kImageandCaptionDataset-vinypanuwt 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,图像识别,自然语言处理,深度学习,人工智能,多媒体分析 数据概述: 该数据集包含来自Flickr平台的图像及其对应的文本描述,记录了图像内容的多角度描述信息。主要特征如下:... -
自然语言处理情感识别数据集NLP-avSentimentIdentificationDataset-mohamedziauddin
自然语言处理情感识别数据集NLP-avSentimentIdentificationDataset-mohamedziauddin 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,数据科学,情感识别,文本分类 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同语境下的情感表达。主要特征如下:... -
雅思备考学习包数据集IELTSPackageDataset-tharakinfinity
雅思备考学习包数据集IELTSPackageDataset-tharakinfinity 数据来源:互联网公开数据 标签:雅思,备考,数据集,语言学习,英语,考试,文本分析,自然语言处理 数据概述: 该数据集包含雅思考试相关的学习资料,旨在为备考雅思的考生提供全面的学习资源。主要特征如下:... -
互联网电影数据库IMDB部分电影样本数据集-thinkerston
互联网电影数据库IMDB部分电影样本数据集-thinkerston 数据来源:互联网公开数据 标签:电影,影评,数据集,自然语言处理,情感分析,机器学习,文本分析,电影数据 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的部分电影样本数据,主要记录了电影的影评信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年份的电影作品。...