-
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源:互联网公开数据 标签:自然语言处理,实体识别,数据集,机器学习,文本分析,地理信息,人工智能,语义理解 数据概述: 该数据集包含通过生成式模型创建的文本数据,专注于山脉相关实体的识别任务。主要特征如下:... -
报告使用文件数据集-justingrima
报告使用文件数据集-justingrima 数据来源:互联网公开数据 标签:报告,文件,数据集,数据分析,文本挖掘,自然语言处理,信息检索,文档管理 数据概述: 该数据集包含了用于报告的文件数据,记录了报告中涉及的各种文件信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不确定,取决于报告所涵盖的时间段。... -
突尼斯阿拉伯语方言情感分析训练数据集-2023-kingabzpro
突尼斯阿拉伯语方言情感分析训练数据集-2023-kingabzpro 数据来源:互联网公开数据 标签:阿拉伯语,方言,情感分析,突尼斯,机器学习,自然语言处理,社交媒体,训练数据 数据概述:... -
情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni
情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni 数据来源:互联网公开数据 标签:情感分析,情感识别,数据集,自然语言处理,机器学习,文本分类,情感计算,数据挖掘 数据概述: 该数据集包含来自FEEL-IT项目的初步研究结果,记录了文本数据的情感识别信息。主要特征如下:... -
专利摘要分析数据集PatentsAbstractsDataset-chizzi25
专利摘要分析数据集PatentsAbstractsDataset-chizzi25 数据来源:互联网公开数据 标签:专利,摘要,文本分析,自然语言处理,机器学习,专利检索,知识产权,技术创新 数据概述: 该数据集包含来自公开专利文献的摘要信息,记录了不同领域的专利技术描述。主要特征如下:... -
优步用户评论数据集UberUserReviewsDataset-smaranikasikdar
优步用户评论数据集UberUserReviewsDataset-smaranikasikdar 数据来源:互联网公开数据 标签:优步,用户评论,情感分析,自然语言处理,数据集,文本挖掘,服务评价,出行 数据概述: 该数据集包含来自优步(Uber)用户的评论数据,记录了用户对优步服务的反馈和评价。主要特征如下:... -
威尼斯商人角色问答聊天机器人评估数据集VeneziaMerchantCharacterQ-AChatbotEvaluationDataset-shresh...
威尼斯商人角色问答聊天机器人评估数据集VeneziaMerchantCharacterQ-AChatbotEvaluationDataset-shreshthabhowmik12 数据来源:互联网公开数据 标签:聊天机器人,问答系统,角色评估,自然语言处理,数据集,评估指标,对话系统,人工智能... -
虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin
虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin 数据来源:互联网公开数据 标签:虚假新闻,假新闻检测,文本分析,自然语言处理,机器学习,新闻分类,信息真实性,数据挖掘 数据概述: 该数据集包含经过处理的虚假新闻数据,旨在用于虚假新闻的检测和分类。主要特征如下:... -
伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524
伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524 数据来源:互联网公开数据 标签:伊斯兰教,书籍,文本分析,宗教研究,自然语言处理,数据集,文化,文献 数据概述: 该数据集包含来自互联网的1000本伊斯兰书籍的文本数据,涵盖了伊斯兰教的各个方面。主要特征如下:... -
数据2024年Reddit帖子数据集-vooono
2024年Reddit帖子数据集-vooono 数据来源:互联网公开数据 标签:社交媒体,Reddit,帖子,文本分析,情感分析,自然语言处理,数据挖掘,用户行为 数据概述: 该数据集包含来自Reddit平台的帖子数据,记录了用户在不同版块发布的文本内容及相关信息。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid
反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分析,自然语言处理,机器学习,分类算法,数据预处理,文本挖掘 数据概述: 该数据集包含经过预处理的反垃圾邮件数据,用于垃圾邮件检测和分类任务。主要特征如下: 时间跨度:... -
土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin
土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:土耳其,科技新闻,自然语言处理,文本分析,新闻摘要,情感分析,机器学习,土耳其语 数据概述: 该数据集包含来自土耳其新闻网站的科技新闻文章,记录了土耳其科技领域的新闻报道。主要特征如下:... -
课程评论数据集ReviewsCourseDataset-anjaneyagupta03
课程评论数据集ReviewsCourseDataset-anjaneyagupta03 数据来源:互联网公开数据 标签:课程评论,数据集,自然语言处理,情感分析,文本挖掘,教育,机器学习,评价 数据概述: 该数据集包含来自在线课程的评论数据,记录了学生对课程的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常涵盖课程的多个学期或年份。... -
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源:互联网公开数据 标签:生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学 数据概述:... -
比利时法语法律问答与法规检索数据集-thedevastator
比利时法语法律问答与法规检索数据集-thedevastator 数据来源:互联网公开数据 标签:法律,比利时,法规,问答,检索,自然语言处理,机器学习,法律科技 数据概述:... -
维基百科平衡性别共指数据集-thedevastator
维基百科平衡性别共指数据集-thedevastator 数据来源:互联网公开数据 标签:共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究 数据概述:... -
自然语言处理项目原始数据集-emilygreen8
自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。... -
问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82
问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,语义理解,信息检索,知识图谱,人工智能 数据概述: 该数据集包含来自tgif问答系统项目的大量问答对数据,记录了用户提问与系统回答的详细信息。主要特征如下:... -
推特情感分析增强数据集-推文情感与文本增强-mks2192
推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:... -
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:...