-
多类别心理健康检测数据集-sidramalikawan
多类别心理健康检测数据集-sidramalikawan 数据来源:互联网公开数据 标签:心理健康,情感识别,文本分析,自然语言处理,机器学习,情感分类,健康管理,精神疾病 数据概述: 该数据集包含用于多类别心理健康检测的文本数据,记录了不同个体在社交媒体上的帖子,文章等文本信息,旨在识别和分类用户的心理健康状态。主要特征如下:... -
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:... -
网页内容与词法特征提取数据集2022年-vanshhagrawal
网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:... -
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto 数据来源:互联网公开数据 标签:文本标注,数据集,自然语言处理,机器学习,数据挖掘,语义分析,人工智能,信息提取 数据概述: 该数据集由图八公司(Figure-... -
大型语言模型用户反馈数据集LMSYSUltraFeedbackDataset-takamichitoda
大型语言模型用户反馈数据集LMSYSUltraFeedbackDataset-takamichitoda 数据来源:互联网公开数据 标签:大型语言模型,用户反馈,数据集,自然语言处理,机器学习,模型评估,人机交互,情感分析 数据概述: 该数据集包含来自大型语言模型(Large Language Model,... -
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源:互联网公开数据 标签:策略问答,数据集,自然语言处理,机器学习,语言模型,训练数据,问答系统,人工智能 数据概述:该数据集包含来自StrategyQA项目的训练数据,用于策略问答系统的训练。主要特征如下:... -
马来西亚电信公司谷歌应用商店评论数据集MalaysianTelecommunicationGooglePlayReviewsDataset-ammarhezamahmed
马来西亚电信公司谷歌应用商店评论数据集MalaysianTelecommunicationGooglePlayReviewsDataset-ammarhezamahmed 数据来源:互联网公开数据 标签:电信行业,用户评论,应用商店,数据集,自然语言处理,情感分析,机器学习,客户服务 数据概述:... -
谷歌街景图像数据集Caption-StreetviewDataset-nemishmurawat420
谷歌街景图像数据集Caption-StreetviewDataset-nemishmurawat420 数据来源:互联网公开数据 标签:街景图像,图像描述,计算机视觉,自然语言处理,数据集,深度学习,图像标注,人工智能 数据概述: 该数据集包含来自谷歌街景的图像数据,并附带相应的图像描述文本,主要用于训练和评估图像描述模型。主要特征如下:... -
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-yhhhrerr
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-yhhhrerr 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,电影评论,深度学习,人工智能... -
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla 数据来源:互联网公开数据 标签:图书,搜索,数据集,自然语言处理,文本分析,信息检索,机器学习,学术研究 数据概述: 该数据集包含来自谷歌图书搜索的响应数据,记录了用户在谷歌图书上进行搜索后得到的图书信息。主要特征如下:... -
Letterboxd电影标题和评论数据集-ecelker
Letterboxd电影标题和评论数据集-ecelker 数据来源:互联网公开数据 标签:电影,评论,数据集,文本分析,情感分析,自然语言处理,电影推荐,用户行为 数据概述: 该数据集包含来自Letterboxd网站的电影标题和用户评论数据,记录了用户对电影的评价和观影体验。主要特征如下:... -
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk 数据来源:互联网公开数据 标签:搜索引擎,搜索行为,数据集,自然语言处理,用户行为分析,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自谷歌搜索的公开信息,记录了用户的搜索查询,搜索结果,以及相关的用户交互行为。主要特征如下:... -
新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona
新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona 数据来源:互联网公开数据 标签:公共卫生,新冠疫情,数据集,文本分析,自然语言处理,疾病传播,信息检索,医学研究 数据概述: 该数据集包含来自互联网公开渠道的新冠疫情相关文章数据,记录了关于新冠疫情的各类报道,研究论文和新闻资讯。主要特征如下:... -
社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad
社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad 数据来源:互联网公开数据 标签:社交媒体,用户行为,机器学习,文本分析,用户画像,情感分析,数据挖掘,自然语言处理 数据概述:... -
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:... -
学术论文文本分析数据集EssayDataset-hienbm02
学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
标注清晰数据集AnnotatedCleanDataset-bf3magic
标注清晰数据集AnnotatedCleanDataset-bf3magic 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,数据清洗,人工智能,自然语言处理,数据科学,数据分析 数据概述: 该数据集包含经过标注和清洗的数据,记录了经过标准化处理的数据样本。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
电商用户评论与评分数据集-wajidlinux
电商用户评论与评分数据集-wajidlinux 数据来源:互联网公开数据 标签:电商,用户评论,评分,情感分析,文本挖掘,机器学习,自然语言处理,消费者行为 数据概述:该数据集包含来自电商平台的消费者评论文本及其对应的评分数据,记录了用户对商品或服务的评价。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量用户评论。... -
CommonLit阅读理解竞赛排行榜数据集-fritzcremer
CommonLit阅读理解竞赛排行榜数据集-fritzcremer 数据来源:互联网公开数据 标签:阅读理解,数据集,自然语言处理,机器学习,文本分析,教育,竞赛,排行榜 数据概述:该数据集包含CommonLit阅读理解竞赛的排行榜数据,记录了参赛者的成绩和排名。主要特征如下: 时间跨度:数据记录的时间范围为竞赛期间。... -
教育平台学生答题数据分析数据集EediParaphrasedDataset-evanarlian
教育平台学生答题数据分析数据集EediParaphrasedDataset-evanarlian 数据来源:互联网公开数据 标签:教育,答题数据,数据集,学生表现,自然语言处理,机器学习,教育评估,学习分析 数据概述: 该数据集源自Eedi教育平台,包含了学生在数学答题过程中产生的详细数据,经过了释义处理。主要特征如下:...