-
电商平台用户评论情感分析数据集-sivaram42
电商平台用户评论情感分析数据集-sivaram42 数据来源:互联网公开数据 标签:情感分析,用户评论,电商平台,自然语言处理,文本挖掘,机器学习,消费者行为,产品评价 数据概述: 该数据集包含来自电商平台的用户评论数据,记录了用户对商品的评价和情感倾向。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了大量历史评论。... -
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,机器学习,文本生成,对话系统,人工智能,语言技术 数据概述:该数据集包含用于训练大型语言模型的提示数据,记录了多种类型的对话和文本生成任务的示例。主要特征如下:... -
音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus
音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus 数据来源:互联网公开数据 标签:音乐,歌词,流派,数据集,文本分析,自然语言处理,情感分析,机器学习 数据概述: 该数据集包含了来自互联网的音乐歌词数据,并按音乐流派进行了分类。主要特征如下: 时间跨度: 数据记录的时间范围跨越多年,具体取决于歌词的发布时间。... -
谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz
谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz 数据来源:互联网公开数据 标签:应用商店,用户评论,情感分析,自然语言处理,数据集,移动应用,文本挖掘,机器学习 数据概述: 该数据集包含来自谷歌应用商店的用户评论数据,记录了用户对不同应用的评价和反馈。主要特征如下:... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01
假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,新闻分类,机器学习,自然语言处理,信息传播,社会研究 数据概述: 该数据集来自假新闻识别挑战赛,主要记录了各类新闻文章及其真实性标签。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。... -
新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi
新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi 数据来源:互联网公开数据 标签:社交媒体,推文,新闻,数据分析,自然语言处理,文本挖掘,舆情分析,传播学 数据概述: 该数据集包含了来自新闻提供者的推文数据,记录了新闻机构在Twitter上的发布信息。主要特征如下:... -
软件代码数据集SoftwareCodeDataset-joshuwamiller
软件代码数据集SoftwareCodeDataset-joshuwamiller 数据来源:互联网公开数据 标签:软件工程,代码分析,数据集,机器学习,自然语言处理,人工智能,编码规范,技术文档 数据概述: 该数据集包含来自多个开源项目的软件代码数据,记录了不同编程语言的源代码及其相关技术文档。主要特征如下:... -
新闻推荐系统数据集NewsRecommendationDataset-mitul777
新闻推荐系统数据集NewsRecommendationDataset-mitul777 数据来源:互联网公开数据 标签:新闻推荐,数据集,推荐系统,机器学习,自然语言处理,信息检索,用户体验,数据挖掘 数据概述: 该数据集专注于新闻推荐领域,记录了用户与新闻内容的交互行为,适用于新闻推荐系统的研究与开发。主要特征如下:... -
情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated
情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated 数据来源:互联网公开数据 标签:情感分析,自然语言处理,嵌入技术,机器学习,数据集,深度学习,文本分类,人工智能 数据概述: 该数据集包含使用GPT-NEO... -
图像标注数据集DataImageCaptioningDataset-whynamee
图像标注数据集DataImageCaptioningDataset-whynamee 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,自然语言处理,深度学习,图像描述,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于训练和评估图像标注模型。主要特征如下: 时间跨度:数据记录的时间跨度不限,持续更新。... -
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,机器翻译,情感分析,语言模型,韩国语 数据概述: 该数据集包含来自世宗人工智能挑战赛的竞赛数据,主要涉及韩国语的文本处理任务。主要特征如下: 时间跨度:数据记录的时间范围为挑战赛期间。... -
基尼亚卢旺达语预训练与微调数据集-kclaude
基尼亚卢旺达语预训练与微调数据集-kclaude 数据来源:互联网公开数据 标签:基尼亚卢旺达语,自然语言处理,数据集,预训练,微调,语言模型,文本数据,非洲语言 数据概述: 该数据集包含了用于基尼亚卢旺达语自然语言处理任务的预训练和微调数据。主要特征如下: 时间跨度:数据记录的时间范围没有明确限制,数据集持续更新,涵盖不同时期的文本资料。... -
维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000
维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 恶意评论, 文本标注, 维基百科 数据概述:... -
图像生成文本-图像对数据集Text-to-ImagePairsDataset-kevin1742064161
图像生成文本-图像对数据集Text-to-ImagePairsDataset-kevin1742064161 数据来源:互联网公开数据 标签:文本生成图像, 图像生成, 文本描述, 图像数据集, 深度学习, 人工智能, 计算机视觉, 自然语言处理 数据概述: 该数据集包含来自多个图像生成项目和平台的文本-... -
阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine
阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine 数据来源:互联网公开数据 标签:新闻真伪, 阿拉伯语, 文本分类, 自然语言处理, 政治新闻, 舆情分析, 机器学习, 语言模型 数据概述:... -
商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl
商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl 数据来源:互联网公开数据 标签:商标识别, 图像描述, 计算机视觉, 文本生成, 图像标注, 深度学习, 自然语言处理, 品牌分析 数据概述: 该数据集包含来自互联网的商标图像及其对应的文字描述,记录了不同商标的视觉特征和相关文本信息。主要特征如下:... -
乌尔都语作者身份识别数据集-drkhurramshahzad
乌尔都语作者身份识别数据集-drkhurramshahzad 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,作者识别,机器学习,文本分类,语料库,语言学 数据概述:该数据集包含来自不同作者的乌尔都语文本,用于进行作者身份识别研究。主要特征如下: 时间跨度:数据没有明确的时间跨度,主要关注文本内容。... -
电影类型预测数据集PredicttheMovieGenreDataset-sanjogmehta
电影类型预测数据集PredicttheMovieGenreDataset-sanjogmehta 数据来源:互联网公开数据 标签:电影,类型预测,数据集,机器学习,自然语言处理,数据分析,娱乐产业,文本分类 数据概述: 该数据集包含来自互联网公开来源的电影相关信息,记录了电影的类型分类任务所需的数据。主要特征如下:... -
印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili
印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili 数据来源:互联网公开数据 标签:情感分析, 文本分类, 印地语, 英语, 多语言, 自然语言处理, 语料库, 机器学习 数据概述: 该数据集包含来自互联网的印地语和英语文本数据,记录了文本的情感倾向。主要特征如下:...