-
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:... -
法国新闻头条文章标题数据集-2022年2月乌克兰冲突与总统选举期间-ukratic
法国新闻头条文章标题数据集-2022年2月乌克兰冲突与总统选举期间-ukratic 数据来源:互联网公开数据 标签:法国,新闻,头条,文章标题,乌克兰冲突,总统选举,政治,社会,媒体,时间序列,文本数据 数据概述:... -
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro 数据来源:互联网公开数据 标签:亚马逊,意大利,评论,情感分析,评分,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含来自亚马逊意大利站的商品评论,共计17,340条,每条评论均包含以下字段: score(评分):客户给出的评分,通常为1-5星。... -
edX在线课程文本数据数据集-shtrausslearning
edX在线课程文本数据数据集-shtrausslearning 数据来源:互联网公开数据 标签:教育,文本数据,在线课程,自然语言处理,机器学习,情感分析,学习行为,课程评估 数据概述: 该数据集包含来自edX在线学习平台的课程文本数据,记录了课程的各种文本信息。主要特征如下: 时间跨度:数据记录的时间跨度为不确定,取决于edX平台课程的发布时间。... -
印度尼西亚诗歌作品集-标题-作者及文本-公开数据-ilhamfp31
印度尼西亚诗歌作品集-标题-作者及文本-公开数据-ilhamfp31 数据来源:互联网公开数据 标签:诗歌,文学,印度尼西亚,文本数据,诗歌创作,作者,标题,文化遗产 数据概述: 本数据集包含7223篇印度尼西亚诗歌作品,每篇诗歌均附有标题和作者信息。数据来源于网络爬取,原始数据包含了诗歌的标题、作者和诗歌正文。 数据用途概述:... -
推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned
推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,文本数据,自然语言处理,机器学习,情感分类,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的文本数据,主要用于情感分析任务。主要特征如下:... -
唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012
唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012 数据来源:互联网公开数据 标签:推特,社交媒体,政治,特朗普,言论分析,文本数据,舆情,时序分析 数据概述: 本数据集收录了自2009年5月至2019年5月期间,美国前总统唐纳德·特朗普在推特平台上发布的所有推文内容,共计约十年时间跨度。... -
情绪识别文本数据集EmotionTextDataset-rimshajanjua
情绪识别文本数据集EmotionTextDataset-rimshajanjua 数据来源:互联网公开数据 标签:情绪识别,文本数据,自然语言处理,机器学习,情感分析,数据集,人工智能,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同情绪标签的文本样本。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。... -
人类对话文本数据集HumanChatDataset-josepjuli
人类对话文本数据集HumanChatDataset-josepjuli 数据来源:互联网公开数据 标签:人类对话,文本数据,自然语言处理,聊天记录,语言模型,机器学习,对话系统,文本分析 数据概述:该数据集包含来自互联网的大量人类对话文本,记录了不同场景下的对话记录。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
情感与文本数据集
标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)... -
罗马乌尔都语文本数据集-akarami
罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。... -
Reddit平台自恋行为讨论帖文数据集-nourmekkijj
Reddit平台自恋行为讨论帖文数据集-nourmekkijj 数据来源:互联网公开数据 标签:Reddit,社交媒体,自恋,心理学,行为分析,文本数据,NLP,情绪分析,社交互动 数据概述:... -
自然语言处理项目原始数据集-emilygreen8
自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。... -
推特情感分析增强数据集-推文情感与文本增强-mks2192
推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:... -
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:... -
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:... -
BERT情感分析数据集-endofnight17j03
BERT情感分析数据集-endofnight17j03 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本数据,BERT,机器学习,情感分类,文本挖掘,NLP 数据概述: 该数据集包含用于情感分析的文本数据,旨在训练和评估基于BERT(Bidirectional Encoder Representations from... -
金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode
金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode 数据来源:互联网公开数据 标签:金融时报,FT,财经新闻,情感分析,文本数据,新闻文章,验证集,CSV 数据概述: 本数据集包含2023年5月20日从《金融时报》(Financial... -
Reddit笑话数据集RedditJokesDataset-vishnuprksh
Reddit笑话数据集RedditJokesDataset-vishnuprksh 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,社交媒体,机器学习,幽默 数据概述: 该数据集包含来自Reddit平台的笑话数据,记录了用户发布的各种类型的笑话及其相关信息。主要特征如下:... -
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:...