找到11,858个数据集

标签: 自然语言处理

过滤结果
  • 新鲜推文数据集2023年NewTweetsDataset2023-ainvkaka

    2025年4月25日   

    新鲜推文数据集2023年NewTweetsDataset2023-ainvkaka 数据来源: 互联网公开数据 标签: 推文,社交媒体,数据集,自然语言处理,情感分析,机器学习,文本挖掘,社会研究 数据概述: 该数据集包含来自2023年的新鲜推文数据,记录了用户在社交媒体平台上的实时交流内容。主要特征如下: 时间跨度:...
    packageimg
  • 疾病与症状关联数据集DiseaseandSymptomsAssociationDataset-hagari

    2025年4月25日   

    疾病与症状关联数据集DiseaseandSymptomsAssociationDataset-hagari 数据来源:互联网公开数据 标签:医疗健康,疾病诊断,症状分析,数据集,机器学习,临床研究,医疗信息学,自然语言处理 数据概述: 该数据集包含来自医疗健康领域的公开数据,记录了多种疾病的症状信息及其关联关系。主要特征如下:...
    packageimg
  • 发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal

    2025年4月25日   

    发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal 数据来源:互联网公开数据 标签:发票分析,商品分类,数据集,自然语言处理,机器学习,销售分析,商业智能,文本分类 数据概述: 该数据集包含来自商业交易发票的商品信息,记录了不同发票中商品的类别和相关信息。主要特征如下:...
    packageimg
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg
  • 文本领域分类数据集-gauravduttakiit

    2025年4月25日   

    文本领域分类数据集-gauravduttakiit 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,数据集,领域识别,数据挖掘,文本分析,人工智能 数据概述: 该数据集包含用于文本领域分类的数据,记录了不同文本内容所属的领域信息。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的文本数据。...
    packageimg
  • 基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg

    2025年4月25日   

    基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:...
    packageimg
  • 推特情感分析数据集TwitterSentimentAnalysisDataset-sakshipratappatil

    2025年4月25日   

    推特情感分析数据集TwitterSentimentAnalysisDataset-sakshipratappatil 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,数据集,自然语言处理,文本挖掘,机器学习,情感分类 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • 儿童书籍情感分析数据集-salma31nidar

    2025年4月25日   

    儿童书籍情感分析数据集-salma31nidar 数据来源:互联网公开数据 标签:儿童书籍,情感分析,数据集,自然语言处理,文本挖掘,机器学习,教育,儿童文学 数据概述: 该数据集包含来自互联网的儿童书籍相关数据,记录了儿童书籍的文本内容及其对应的情感标签。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期出版的儿童书籍。...
    packageimg
  • IMDB电影评论情感分析数据集IMDBSentimentAnalysisDataset-mmeredith

    2025年4月25日   

    IMDB电影评论情感分析数据集IMDBSentimentAnalysisDataset-mmeredith 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,评论分析,人工智能 数据概述:该数据集包含来自IMDB电影数据库的影评数据,记录了用户对电影的评论及其对应的情感标签(正面或负面)。主要特征如下:...
    packageimg
  • 文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava

    2025年4月25日   

    文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源:互联网公开数据 标签:文档处理,数据集,文本分类,自然语言处理,机器学习,信息检索,文本分析,数据挖掘 数据概述: 该数据集包含经过过滤和分类的文档数据,记录了各类文档的文本内容和分类标签。主要特征如下: 时间跨度:...
    packageimg
  • 游戏评论数据集GameReviewsDataset-kanishknavale

    2025年4月25日   

    游戏评论数据集GameReviewsDataset-kanishknavale 数据来源:互联网公开数据 标签:游戏,评论,数据集,自然语言处理,情感分析,用户体验,市场研究,数据挖掘 数据概述: 该数据集包含来自各大游戏平台和社交媒体的游戏评论数据,记录了玩家对各类游戏的评价和反馈。主要特征如下:...
    packageimg
  • 信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya

    2025年4月25日   

    信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya 数据来源:互联网公开数据 标签:信息检索,查询分析,数据集,搜索引擎,自然语言处理,数据挖掘,人工智能,机器学习 数据概述: 该数据集包含了来自多个搜索引擎和在线信息检索系统的用户查询数据,记录了用户在搜索过程中的查询语句及相关信息。主要特征如下:...
    packageimg
  • 罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1

    2025年4月25日   

    罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1 数据来源:互联网公开数据 标签:语言转换,字符编码,数据集,泰卢固语,自然语言处理,文本转换,机器学习,语言学 数据概述:...
    packageimg
  • 疫情前10000条推特数据分析数据集Pre-COVID-1910-000TweetsDataset-kareemrasheed89

    2025年4月25日   

    疫情前10000条推特数据分析数据集Pre-COVID-1910-000TweetsDataset-kareemrasheed89 数据来源:互联网公开数据 标签:社交媒体,数据分析,数据集,文本挖掘,情感分析,机器学习,情感识别,自然语言处理 数据概述:...
    packageimg
  • 美国YouTube评论情感分析清洗数据集

    2025年4月25日   

    美国YouTube评论情感分析清洗数据集 数据来源:互联网公开数据 标签:YouTube评论,情感分析,文本数据,自然语言处理,情感分类,机器学习,数据清洗,社交媒体 数据概述:...
    packageimg
  • 用户反馈意见分析数据集-uom200644f

    2025年4月25日   

    用户反馈意见分析数据集-uom200644f 数据来源:互联网公开数据 标签:用户反馈,情感分析,文本挖掘,自然语言处理,数据集,意见挖掘,客户服务,机器学习 数据概述: 该数据集包含来自不同渠道的用户反馈意见,记录了用户对产品,服务或体验的评价。主要特征如下: 时间跨度:数据记录的时间范围不确定,取决于数据源的更新频率。...
    packageimg
  • 客户服务工单数据集-vijaythurimella

    2025年4月25日   

    客户服务工单数据集-vijaythurimella 数据来源:互联网公开数据 标签:客户服务,工单,文本分析,自然语言处理,机器学习,服务质量,客户体验,数据分析 数据概述: 该数据集包含客户服务工单数据,记录了客户与服务提供商之间的互动信息。主要特征如下: 时间跨度:数据记录的时间范围,从[起始年份]到[结束年份]。...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • 词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid

    2025年4月25日   

    词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid 数据来源:互联网公开数据 标签:自然语言处理,词向量,文档向量,数据集,机器学习,文本分析,向量化,文本挖掘 数据概述:该数据集包含用于生成词向量(Word2Vec)和文档向量(Doc2Vec)的数据,记录了文本语料库的词汇和文档特征。主要特征如下:...
    packageimg
  • 微博七模态数据集Weibo7ModesDataSet-ginrawin

    2025年4月25日   

    微博七模态数据集Weibo7ModesDataSet-ginrawin 数据来源:互联网公开数据 标签:微博,数据集,多模态,社交媒体,自然语言处理,图像处理,音频处理 数据概述: 该数据集包含来自微博的七模态数据,记录了用户发布的微博内容及其相关多媒体信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg