-
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:... -
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:... -
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:... -
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源:互联网公开数据 标签:金融,新闻标题,数据集,文本分析,自然语言处理,机器学习,经济研究,新闻挖掘 数据概述: 该数据集包含来自多个金融新闻来源的标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:... -
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe 数据来源:互联网公开数据 标签:生物医学,情感分析,数据集,自然语言处理,文本挖掘,机器学习,健康信息,数据科学 数据概述: 该数据集包含来自生物医学领域的文本数据,记录了相关文献,新闻,评论等文本中的情感倾向。主要特征如下:... -
比特币推文数据集BTCTweetsDataset-senaada
比特币推文数据集BTCTweetsDataset-senaada 数据来源:互联网公开数据 标签:比特币,推文,数据集,社交媒体,自然语言处理,金融市场,投资分析,机器学习 数据概述:该数据集包含来自推特的比特币相关推文数据,记录了用户讨论比特币的言论和观点。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio 数据来源:互联网公开数据 标签:酒店,评论,情感分析,文本挖掘,自然语言处理,旅游,纽约,数据集 数据概述: 该数据集包含来自纽约酒店的评论数据,记录了用户对纽约各酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含近期用户评论。... -
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:... -
训练健康描述与数据数据集-sumeetbabar
训练健康描述与数据数据集-sumeetbabar 数据来源:互联网公开数据 标签:健康,训练,描述,数据集,自然语言处理,文本分析,医学,健康管理 数据概述: 该数据集包含关于训练和健康描述的数据,记录了与训练相关的健康信息。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时间段的训练和健康数据。... -
亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan
亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan 数据来源:互联网公开数据 标签:图书评价,数据集,用户行为,情感分析,图书推荐,自然语言处理,电子商务,机器学习 数据概述:... -
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。... -
人工智能对话数据集SiriusAIDataset-qacenn
人工智能对话数据集SiriusAIDataset-qacenn 数据来源:互联网公开数据 标签:人工智能,对话系统,数据集,自然语言处理,机器学习,聊天机器人,用户交互,智能客服 数据概述:该数据集包含来自Sirius AI的对话数据,记录了用户与AI助手之间的交互对话。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
气候变化推特数据集ClimateTweetsDataset-krigeverwey
气候变化推特数据集ClimateTweetsDataset-krigeverwey 数据来源:互联网公开数据 标签:气候变化,推特数据,社交媒体分析,环境研究,数据集,自然语言处理,社会影响,公众舆论 数据概述:该数据集包含来自推特的关于气候变化的推文数据,记录了用户对于气候变化问题的看法和讨论。主要特征如下:... -
英西语翻译数据集English-SpanishTranslationDataset-nouranader
英西语翻译数据集English-SpanishTranslationDataset-nouranader 数据来源:互联网公开数据 标签:翻译,语言学,数据集,机器学习,自然语言处理,文本分析,多语言支持,语言学习 数据概述:该数据集包含来自互联网的英西语翻译数据,记录了英语和西班牙语之间的文本对应关系。主要特征如下:... -
推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006
推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,语义理解,数据集,深度学习,文本分类,情感分析,机器学习,语言模型 数据概述: 该数据集专为训练和检测推断语义模型(InferSent)而设计,记录了用于语义理解和推断的文本数据。主要特征如下:... -
英印互译数据集EngHindiDataset-abcdef999
英印互译数据集EngHindiDataset-abcdef999 数据来源:互联网公开数据 标签:机器翻译,数据集,印地语,英语,自然语言处理,文本数据,跨语言,语言学 数据概述: 该数据集包含了英语和印地语的平行语料,即互译的句子对。主要特征如下: 时间跨度:数据记录的时间范围不限,收录了不同时期,不同来源的文本。... -
推特评论情感分析数据集ProcessedTwitterCommentDataset-andrianang
推特评论情感分析数据集ProcessedTwitterCommentDataset-andrianang 数据来源:互联网公开数据 标签:推特,评论,情感分析,自然语言处理,文本挖掘,机器学习,社交媒体,情感分类 数据概述: 该数据集包含了从推特平台抓取的评论数据,主要用于情感分析和文本挖掘研究。主要特征如下:... -
推特情感分析数据集-情感分类与文本数据清洗-推特文本-
推特情感分析数据集-情感分类与文本数据清洗-推特文本- 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,清洗,情感分类,自然语言处理,社交媒体,情绪识别 数据概述: 本数据集源自推特(Twitter)平台,包含经过处理的推特文本数据,用于情感分析研究。 数据集共包含三个主要字段:情感标签、清洗后的推特文本、原始推特文本。... -
文本分类数据集WordClassificationDataset-jcatumba
文本分类数据集WordClassificationDataset-jcatumba 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,人工智能,语言学,数据科学 数据概述:该数据集包含来自多个来源的文本数据,记录了不同类别的文本信息,适用于文本分类任务。主要特征如下:... -
事件原始数据数据集EventsRawDataDataset-happy1996
事件原始数据数据集EventsRawDataDataset-happy1996 数据来源:互联网公开数据 标签:事件,数据集,文本分析,自然语言处理,信息抽取,舆情分析,社会科学,新闻 数据概述: 该数据集包含来自不同来源的事件原始数据,记录了各种社会,政治,经济等领域的事件信息。主要特征如下:...