数据集 - 海数据

电商平台用户评论情感分析数据集-sivaram42

2025年5月28日

电商平台用户评论情感分析数据集-sivaram42 数据来源：互联网公开数据标签：情感分析，用户评论，电商平台，自然语言处理，文本挖掘，机器学习，消费者行为，产品评价数据概述：该数据集包含来自电商平台的用户评论数据，记录了用户对商品的评价和情感倾向。主要特征如下：时间跨度：数据记录的时间范围不明确，但包含了大量历史评论。...

ZIP

大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu

2025年5月28日

大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源：互联网公开数据标签：大型语言模型，数据集，自然语言处理，机器学习，文本生成，对话系统，人工智能，语言技术数据概述：该数据集包含用于训练大型语言模型的提示数据，记录了多种类型的对话和文本生成任务的示例。主要特征如下：...

ZIP

音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus

2025年5月28日

音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus 数据来源：互联网公开数据标签：音乐，歌词，流派，数据集，文本分析，自然语言处理，情感分析，机器学习数据概述：该数据集包含了来自互联网的音乐歌词数据，并按音乐流派进行了分类。主要特征如下：时间跨度：数据记录的时间范围跨越多年，具体取决于歌词的发布时间。...

ZIP

谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz

2025年5月28日

谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz 数据来源：互联网公开数据标签：应用商店，用户评论，情感分析，自然语言处理，数据集，移动应用，文本挖掘，机器学习数据概述：该数据集包含来自谷歌应用商店的用户评论数据，记录了用户对不同应用的评价和反馈。主要特征如下：...

ZIP

评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906

2025年5月28日

评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源：互联网公开数据标签：自然语言处理，文本翻译，数据集，语言模型，机器学习，文本校对，机器翻译，文本处理数据概述：该数据集包含来自互联网的评论数据，记录了不同语言之间的评论翻译与校对信息。主要特征如下：...

ZIP

假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01

2025年5月28日

假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01 数据来源：互联网公开数据标签：假新闻，数据集，文本分析，新闻分类，机器学习，自然语言处理，信息传播，社会研究数据概述：该数据集来自假新闻识别挑战赛，主要记录了各类新闻文章及其真实性标签。主要特征如下：时间跨度：数据记录的时间范围从2016年到2021年。...

ZIP

新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi

2025年5月28日

新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi 数据来源：互联网公开数据标签：社交媒体，推文，新闻，数据分析，自然语言处理，文本挖掘，舆情分析，传播学数据概述：该数据集包含了来自新闻提供者的推文数据，记录了新闻机构在Twitter上的发布信息。主要特征如下：...

ZIP

软件代码数据集SoftwareCodeDataset-joshuwamiller

2025年5月28日

软件代码数据集SoftwareCodeDataset-joshuwamiller 数据来源：互联网公开数据标签：软件工程，代码分析，数据集，机器学习，自然语言处理，人工智能，编码规范，技术文档数据概述：该数据集包含来自多个开源项目的软件代码数据，记录了不同编程语言的源代码及其相关技术文档。主要特征如下：...

ZIP

新闻推荐系统数据集NewsRecommendationDataset-mitul777

2025年5月28日

新闻推荐系统数据集NewsRecommendationDataset-mitul777 数据来源：互联网公开数据标签：新闻推荐，数据集，推荐系统，机器学习，自然语言处理，信息检索，用户体验，数据挖掘数据概述：该数据集专注于新闻推荐领域，记录了用户与新闻内容的交互行为，适用于新闻推荐系统的研究与开发。主要特征如下：...

ZIP

情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated

2025年5月28日

情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated 数据来源：互联网公开数据标签：情感分析，自然语言处理，嵌入技术，机器学习，数据集，深度学习，文本分类，人工智能数据概述：该数据集包含使用GPT-NEO...

ZIP

图像标注数据集DataImageCaptioningDataset-whynamee

2025年5月28日

图像标注数据集DataImageCaptioningDataset-whynamee 数据来源：互联网公开数据标签：图像标注，数据集，计算机视觉，自然语言处理，深度学习，图像描述，文本生成，人工智能数据概述：该数据集包含图像及其对应的文本描述，旨在用于训练和评估图像标注模型。主要特征如下：时间跨度：数据记录的时间跨度不限，持续更新。...

ZIP

世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro

2025年5月28日

世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源：互联网公开数据标签：人工智能，数据集，自然语言处理，文本分类，机器翻译，情感分析，语言模型，韩国语数据概述：该数据集包含来自世宗人工智能挑战赛的竞赛数据，主要涉及韩国语的文本处理任务。主要特征如下：时间跨度：数据记录的时间范围为挑战赛期间。...

ZIP

基尼亚卢旺达语预训练与微调数据集-kclaude

2025年5月28日

基尼亚卢旺达语预训练与微调数据集-kclaude 数据来源：互联网公开数据标签：基尼亚卢旺达语，自然语言处理，数据集，预训练，微调，语言模型，文本数据，非洲语言数据概述：该数据集包含了用于基尼亚卢旺达语自然语言处理任务的预训练和微调数据。主要特征如下：时间跨度：数据记录的时间范围没有明确限制，数据集持续更新，涵盖不同时期的文本资料。...

ZIP

维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000

2025年5月28日

维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000 数据来源：互联网公开数据标签：文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 恶意评论, 文本标注, 维基百科数据概述：...

ZIP

图像生成文本-图像对数据集Text-to-ImagePairsDataset-kevin1742064161

2025年5月28日

图像生成文本-图像对数据集Text-to-ImagePairsDataset-kevin1742064161 数据来源：互联网公开数据标签：文本生成图像, 图像生成, 文本描述, 图像数据集, 深度学习, 人工智能, 计算机视觉, 自然语言处理数据概述：该数据集包含来自多个图像生成项目和平台的文本-...

ZIP

阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine

2025年5月28日

阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine 数据来源：互联网公开数据标签：新闻真伪, 阿拉伯语, 文本分类, 自然语言处理, 政治新闻, 舆情分析, 机器学习, 语言模型数据概述：...

ZIP

商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl

2025年5月28日

商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl 数据来源：互联网公开数据标签：商标识别, 图像描述, 计算机视觉, 文本生成, 图像标注, 深度学习, 自然语言处理, 品牌分析数据概述：该数据集包含来自互联网的商标图像及其对应的文字描述，记录了不同商标的视觉特征和相关文本信息。主要特征如下：...

ZIP

乌尔都语作者身份识别数据集-drkhurramshahzad

2025年5月28日

乌尔都语作者身份识别数据集-drkhurramshahzad 数据来源：互联网公开数据标签：自然语言处理，文本分析，乌尔都语，作者识别，机器学习，文本分类，语料库，语言学数据概述：该数据集包含来自不同作者的乌尔都语文本，用于进行作者身份识别研究。主要特征如下：时间跨度：数据没有明确的时间跨度，主要关注文本内容。...

ZIP

电影类型预测数据集PredicttheMovieGenreDataset-sanjogmehta

2025年5月28日

电影类型预测数据集PredicttheMovieGenreDataset-sanjogmehta 数据来源：互联网公开数据标签：电影，类型预测，数据集，机器学习，自然语言处理，数据分析，娱乐产业，文本分类数据概述：该数据集包含来自互联网公开来源的电影相关信息，记录了电影的类型分类任务所需的数据。主要特征如下：...

ZIP

印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili

2025年5月28日

印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili 数据来源：互联网公开数据标签：情感分析, 文本分类, 印地语, 英语, 多语言, 自然语言处理, 语料库, 机器学习数据概述：该数据集包含来自互联网的印地语和英语文本数据，记录了文本的情感倾向。主要特征如下：...

ZIP

找到11,808个数据集

注册成功！