找到995个数据集

标签: 文本数据

过滤结果
  • 乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi

    2025年4月26日   

    乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi 数据来源:互联网公开数据 标签:乌尔都语,罗马字符,文本数据,自然语言处理,NLP,语言学,数据集,文本分析 数据概述: 该数据集包含使用罗马字符书写的乌尔都语文本数据,旨在促进乌尔都语的自然语言处理研究。主要特征如下:...
    packageimg
  • 大规模通用文本数据集LLM-Text-Data-abramova

    2025年4月26日   

    大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:...
    packageimg
  • Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga

    2025年4月26日   

    Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本数据,机器学习,评论数据,舆情分析,文本挖掘 数据概述:...
    packageimg
  • 增强情感文本数据集AugmentedEmotextDataset-sidd3k

    2025年4月26日   

    增强情感文本数据集AugmentedEmotextDataset-sidd3k 数据来源:互联网公开数据 标签:情感分析,文本数据,数据集,自然语言处理,机器学习,情感分类,社交媒体,情绪识别 数据概述: 该数据集包含增强的情感文本数据,主要来源于社交媒体平台和评论文本,旨在用于情感分析,情绪识别等自然语言处理任务。主要特征如下:...
    packageimg
  • 自然语言处理NLP实践数据集-north151

    2025年4月26日   

    自然语言处理NLP实践数据集-north151 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本数据,机器学习,语言模型,文本分类,情感分析,信息抽取,数据集 数据概述: 该数据集包含用于自然语言处理(NLP)实践的文本数据,主要用于训练和评估NLP模型。主要特征如下: 时间跨度:数据无明确时间范围,涵盖多种文本数据类型。...
    packageimg
  • 孟加拉语文本情感分析数据集-shadikaafroze

    2025年4月25日   

    孟加拉语文本情感分析数据集-shadikaafroze 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本数据,孟加拉语,机器学习,情感分类,数据集,语言学 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据收集时间跨度未知,但包含了近期和历史的孟加拉语文本。...
    packageimg
  • 阿拉伯语文本情感分析数据集-akshat18

    2025年4月25日   

    阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:...
    packageimg
  • 伊朗地区波斯语推特文本数据集LimitedPersianIRTwitterTextDataset-amirali10281

    2025年4月25日   

    伊朗地区波斯语推特文本数据集LimitedPersianIRTwitterTextDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,推特,文本数据,自然语言处理,情感分析,社交媒体,伊朗,机器学习 数据概述: 该数据集包含了来自伊朗地区的波斯语推特文本数据,旨在为自然语言处理和文本分析研究提供支持。主要特征如下:...
    packageimg
  • 乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir

    2025年4月25日   

    乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir 数据来源:互联网公开数据 标签:情感分析,自然语言处理,乌尔都语,文本数据,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含乌尔都语文本数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 光学字符识别文本数据集OCRTextDataset-hardik836

    2025年4月25日   

    光学字符识别文本数据集OCRTextDataset-hardik836 数据来源:互联网公开数据 标签:光学字符识别,文本数据,数据集,机器学习,图像处理,自然语言处理,人工智能,计算机视觉 数据概述: 该数据集包含了来自多种来源的扫描文档和图像的文本数据,适用于光学字符识别(OCR)技术的研究和应用。主要特征如下:...
    packageimg
  • 俄罗斯经济新闻数据集

    2025年4月25日   

    俄罗斯经济新闻数据集 数据来源:互联网公开数据 标签:经济新闻,俄罗斯,新闻分类,情感分析,二分类,文本数据,时间序列 数据概述:...
    packageimg
  • 英语学习文本数据集en-train-csv-elguapo

    2025年4月25日   

    英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:...
    packageimg
  • 创意写作文本清洗数据集-mohamednafea01

    2025年4月25日   

    创意写作文本清洗数据集-mohamednafea01 数据来源:互联网公开数据 标签:文本数据,创意写作,数据清洗,自然语言处理,文本分析,语料库,机器学习,NLP 数据概述: 该数据集包含经过清洗的创意写作文本,旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的创意写作文本。...
    packageimg
  • 马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav

    2025年4月25日   

    马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • 西班牙语文本情感分析数据集-suramyajadhav

    2025年4月25日   

    西班牙语文本情感分析数据集-suramyajadhav 数据来源:互联网公开数据 标签:情感分析,西班牙语,文本数据,自然语言处理,机器学习,情绪识别,语言学,文本挖掘 数据概述: 该数据集包含来自西班牙语文本的情感标注数据,用于训练和评估情感分析模型。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但数据涵盖了多个时间段的文本内容。 地理范围:...
    packageimg
  • 互联网电影数据库IMDB电影评论情感分析数据集-swarajkedari

    2025年4月25日   

    互联网电影数据库IMDB电影评论情感分析数据集-swarajkedari 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,机器学习,文本数据,情感分类,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 古兰经阿拉伯语章节数据集-haykelbargougui

    2025年4月25日   

    古兰经阿拉伯语章节数据集-haykelbargougui 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,文本数据,宗教,伊斯兰教,自然语言处理,文本分析,语言学 数据概述: 该数据集包含古兰经的阿拉伯语文本数据,记录了古兰经的各个章节及其对应的经文。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容,即从古兰经的创作时期至今。...
    packageimg
  • 情感分析二元分类数据集-chathushkajeewantha

    2025年4月25日   

    情感分析二元分类数据集-chathushkajeewantha 数据来源:互联网公开数据 标签:情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性,数据集,中文 数据概述: 该数据集包含用于情感分析的文本数据,主要用于二元情感分类任务。主要特征如下: 时间跨度:数据记录的时间范围未明确,但包含各类文本数据。...
    packageimg
  • 希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray

    2025年4月25日   

    希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray 数据来源:互联网公开数据 标签:希伯来语,情感分析,文本数据,自然语言处理,机器学习,语言学,数据集,NLP 数据概述: 该数据集包含来自互联网的希伯来语文本数据,用于情感分析任务。主要特征如下: 时间跨度:...
    packageimg