找到5,805个数据集

标签: 文本分析

过滤结果
  • 幽默笑话语料库分析数据集HumorJokeCorpusAnalysis-wilmernystrm

    2025年5月12日   

    幽默笑话语料库分析数据集HumorJokeCorpusAnalysis-wilmernystrm 数据来源:互联网公开数据 标签:幽默, 笑话, 文本分析, 情感分析, 自然语言处理, 社交媒体, 语料库, 数据挖掘 数据概述: 该数据集包含来自Reddit等社交媒体平台的幽默笑话语料,记录了各种类型和主题的笑话文本及其相关元数据。主要特征如下:...
    packageimg
  • 葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana

    2025年5月11日   

    葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴, 评论, 文本分析, 自然语言处理, 多语言, 情感分析, 数据标注 数据概述: 该数据集包含来自多个来源的葡萄酒品鉴评论文本,记录了不同年份、不同葡萄酒的品鉴笔记。主要特征如下:...
    packageimg
  • vk笑话数据集VKAnecdotesDataset-boogiewoogieqq

    2025年5月28日   

    vk笑话数据集VKAnecdotesDataset-boogiewoogieqq 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,自然语言处理,情感分析,机器学习,文本挖掘,娱乐内容 数据概述: 该数据集包含来自vk社交平台(vk.com)的笑话和幽默内容数据,记录了用户分享的笑话文本及部分相关信息。主要特征如下:...
    packageimg
  • 文本摘要多方法评估数据集TextSummarizationMulti-methodEvaluationDataset-arousrihab

    2025年5月28日   

    文本摘要多方法评估数据集TextSummarizationMulti-methodEvaluationDataset-arousrihab 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 摘要生成, 评估, 机器学习, 深度学习, 摘要模型, 文本分析 数据概述:...
    packageimg
  • 音乐歌词数据集Dataset-Lyrics-Musics-italomarcelo

    2025年5月28日   

    音乐歌词数据集Dataset-Lyrics-Musics-italomarcelo 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,音乐分析,情感分析,数据挖掘 数据概述: 该数据集包含来自多个音乐平台和公开来源的音乐歌词数据,记录了不同歌曲的歌词文本及相关信息。主要特征如下:...
    packageimg
  • Twitter大规模自然语言处理数据集2015年至今超过1500万条推文-sourabhkumarsantra

    2025年5月28日   

    Twitter大规模自然语言处理数据集2015年至今超过1500万条推文-sourabhkumarsantra 数据来源:互联网公开数据 标签:社交媒体,自然语言处理,数据集,文本分析,机器学习,情感分析,数据挖掘,文本分类 数据概述:...
    packageimg
  • 堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh

    2025年5月28日   

    堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh 数据来源:互联网公开数据 标签:堤坝, 巡逻, 防洪, 文本, 法律法规, 自然语言处理, 文本分析, 越南语 数据概述: 该数据集包含来自越南官方文件的文本数据,记录了关于堤坝巡逻和防洪的相关规定和说明。主要特征如下:...
    packageimg
  • 俄罗斯社交媒体内容分析数据集RussiaSocialMediaContentAnalysis-dawndarasms

    2025年5月28日   

    俄罗斯社交媒体内容分析数据集RussiaSocialMediaContentAnalysis-dawndarasms 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 俄罗斯, 内容分析, 舆情监测, 政治传播, 语言识别, 数据挖掘 数据概述: 该数据集包含来自社交媒体平台的数据,记录了与俄罗斯相关的社交媒体内容。主要特征如下:...
    packageimg
  • 比特币论坛讨论数据r-Bitcoin2010年9月至2022年6月数据集-jonathong

    2025年5月28日   

    比特币论坛讨论数据r-Bitcoin2010年9月至2022年6月数据集-jonathong 数据来源:互联网公开数据 标签:比特币,论坛,数据,区块链,加密货币,社区,文本分析,情感分析 数据概述:该数据集包含来自Reddit论坛 r/Bitcoin...
    packageimg
  • 新闻摘要生成数据集NewsSummarizationDataset-moatazsaleh

    2025年5月28日   

    新闻摘要生成数据集NewsSummarizationDataset-moatazsaleh 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 机器翻译, 深度学习, 文本分析, 语料库, 摘要生成 数据概述: 该数据集包含预处理过的新闻文章及其对应的摘要,用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset)

    2025年5月28日   

    标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset) 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本分析,深度学习,总结 数据概述:该数据集包含来自Samthemar项目的输出总结数据,记录了各种文本的摘要信息。主要特征如下:...
    packageimg
  • 图像商品描述数据集ImageProductDescription-antonious512

    2025年5月28日   

    图像商品描述数据集ImageProductDescription-antonious512 数据来源:互联网公开数据 标签:商品描述, 图像识别, 电商, 文本分析, 数据集, 图像, 商品, 深度学习 数据概述: 该数据集包含来自电商平台的商品信息,记录了商品的名称与对应的图像。主要特征如下:...
    packageimg
  • 标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset)

    2025年5月28日   

    标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset) 数据来源:互联网公开数据 标签:聊天机器人,客户服务,自然语言处理,文本分析,数据集,机器学习,对话系统,人工智能 数据概述: 该数据集包含由 Kundansingh08...
    packageimg
  • TinyBERT文本相似度计算数据集-ktgiahieu

    2025年5月28日   

    TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。...
    packageimg
  • 数据帧替换操作数据集-goldy222

    2025年5月28日   

    数据帧替换操作数据集-goldy222 数据来源:互联网公开数据 标签:数据处理,数据清洗,数据转换,数据集,文本分析,机器学习,数据科学,Python 数据概述: 该数据集包含用于数据帧(DataFrame)替换操作的模拟数据,记录了在数据处理过程中,使用不同方法替换数据帧中特定值的情况。主要特征如下: 时间跨度: 数据记录的时间范围不限,模拟数据。...
    packageimg
  • 短信内容分类数据集SMSContentClassification-bobaaayoung

    2025年5月28日   

    短信内容分类数据集SMSContentClassification-bobaaayoung 数据来源:互联网公开数据 标签:短信分类, 文本分析, 自然语言处理, 垃圾短信, 营销短信, 短信内容, 文本标注, 二分类 数据概述: 该数据集包含来自互联网的短信内容,记录了用于短信内容分类的文本示例。主要特征如下:...
    packageimg
  • 政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart

    2025年5月28日   

    政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart 数据来源:互联网公开数据 标签:命名实体识别, 缩写识别, 文本分析, 自然语言处理, 机器学习, 政府机构, 数据标注, 语料库构建 数据概述:...
    packageimg
  • Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde

    2025年5月28日   

    Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde 数据来源:互联网公开数据 标签:文本分析,毒性检测,自然语言处理,数据集,机器学习,情感分析,评论清洗,社交媒体 数据概述: 该数据集包含了来自 Jigsaw...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7

    2025年5月28日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,自然语言处理,消费者行为,数据挖掘,机器学习 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对不同商品的评价和反馈。主要特征如下:...
    packageimg
  • 书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp

    2025年5月28日   

    书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp 数据来源:互联网公开数据 标签:推文,书籍,情感分析,社交媒体,自然语言处理,数据集,文本分析,社会研究 数据概述:该数据集包含来自社交媒体平台的233,360条与书籍相关的推文,并附带了情感分析结果。主要特征如下:...
    packageimg