找到937个数据集

标签: 文本数据

过滤结果
  • 法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo

    2025年4月23日   

    法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:...
    packageimg
  • 法国新闻头条文章标题数据集-2022年2月乌克兰冲突与总统选举期间-ukratic

    2025年4月23日   

    法国新闻头条文章标题数据集-2022年2月乌克兰冲突与总统选举期间-ukratic 数据来源:互联网公开数据 标签:法国,新闻,头条,文章标题,乌克兰冲突,总统选举,政治,社会,媒体,时间序列,文本数据 数据概述:...
    packageimg
  • 亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro

    2025年4月23日   

    亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro 数据来源:互联网公开数据 标签:亚马逊,意大利,评论,情感分析,评分,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含来自亚马逊意大利站的商品评论,共计17,340条,每条评论均包含以下字段: score(评分):客户给出的评分,通常为1-5星。...
    packageimg
  • edX在线课程文本数据数据集-shtrausslearning

    2025年4月23日   

    edX在线课程文本数据数据集-shtrausslearning 数据来源:互联网公开数据 标签:教育,文本数据,在线课程,自然语言处理,机器学习,情感分析,学习行为,课程评估 数据概述: 该数据集包含来自edX在线学习平台的课程文本数据,记录了课程的各种文本信息。主要特征如下: 时间跨度:数据记录的时间跨度为不确定,取决于edX平台课程的发布时间。...
    packageimg
  • 印度尼西亚诗歌作品集-标题-作者及文本-公开数据-ilhamfp31

    2025年4月23日   

    印度尼西亚诗歌作品集-标题-作者及文本-公开数据-ilhamfp31 数据来源:互联网公开数据 标签:诗歌,文学,印度尼西亚,文本数据,诗歌创作,作者,标题,文化遗产 数据概述: 本数据集包含7223篇印度尼西亚诗歌作品,每篇诗歌均附有标题和作者信息。数据来源于网络爬取,原始数据包含了诗歌的标题、作者和诗歌正文。 数据用途概述:...
    packageimg
  • 推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned

    2025年4月23日   

    推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,文本数据,自然语言处理,机器学习,情感分类,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012

    2025年4月23日   

    唐纳德-特朗普推特内容分析数据集-2009年5月至2019年5月-jimsu2012 数据来源:互联网公开数据 标签:推特,社交媒体,政治,特朗普,言论分析,文本数据,舆情,时序分析 数据概述: 本数据集收录了自2009年5月至2019年5月期间,美国前总统唐纳德·特朗普在推特平台上发布的所有推文内容,共计约十年时间跨度。...
    packageimg
  • 情绪识别文本数据集EmotionTextDataset-rimshajanjua

    2025年4月23日   

    情绪识别文本数据集EmotionTextDataset-rimshajanjua 数据来源:互联网公开数据 标签:情绪识别,文本数据,自然语言处理,机器学习,情感分析,数据集,人工智能,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同情绪标签的文本样本。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。...
    packageimg
  • 人类对话文本数据集HumanChatDataset-josepjuli

    2025年4月23日   

    人类对话文本数据集HumanChatDataset-josepjuli 数据来源:互联网公开数据 标签:人类对话,文本数据,自然语言处理,聊天记录,语言模型,机器学习,对话系统,文本分析 数据概述:该数据集包含来自互联网的大量人类对话文本,记录了不同场景下的对话记录。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 情感与文本数据集

    2025年4月23日   

    标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)...
    packageimg
  • 罗马乌尔都语文本数据集-akarami

    2025年4月23日   

    罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。...
    packageimg
  • Reddit平台自恋行为讨论帖文数据集-nourmekkijj

    2025年4月23日   

    Reddit平台自恋行为讨论帖文数据集-nourmekkijj 数据来源:互联网公开数据 标签:Reddit,社交媒体,自恋,心理学,行为分析,文本数据,NLP,情绪分析,社交互动 数据概述:...
    packageimg
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg
  • 推特情感分析增强数据集-推文情感与文本增强-mks2192

    2025年4月23日   

    推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:...
    packageimg
  • 跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

    2025年4月23日   

    跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:...
    packageimg
  • 大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q

    2025年4月22日   

    大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:...
    packageimg
  • BERT情感分析数据集-endofnight17j03

    2025年4月22日   

    BERT情感分析数据集-endofnight17j03 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本数据,BERT,机器学习,情感分类,文本挖掘,NLP 数据概述: 该数据集包含用于情感分析的文本数据,旨在训练和评估基于BERT(Bidirectional Encoder Representations from...
    packageimg
  • 金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode

    2025年4月22日   

    金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode 数据来源:互联网公开数据 标签:金融时报,FT,财经新闻,情感分析,文本数据,新闻文章,验证集,CSV 数据概述: 本数据集包含2023年5月20日从《金融时报》(Financial...
    packageimg
  • Reddit笑话数据集RedditJokesDataset-vishnuprksh

    2025年4月22日   

    Reddit笑话数据集RedditJokesDataset-vishnuprksh 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,社交媒体,机器学习,幽默 数据概述: 该数据集包含来自Reddit平台的笑话数据,记录了用户发布的各种类型的笑话及其相关信息。主要特征如下:...
    packageimg
  • 英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong

    2025年4月22日   

    英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:...
    packageimg