找到5,815个数据集

标签: 文本分析

过滤结果
  • 抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12

    2025年4月24日   

    抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12 数据来源:互联网公开数据 标签:心理健康,抑郁症,焦虑症,数据集,文本分析,自然语言处理,情感分析,医疗健康 数据概述: 该数据集包含来自社交媒体平台的用户生成内容,记录了用户关于抑郁症和焦虑症的讨论及相关情绪表达。主要特征如下:...
    packageimg
  • 新闻分类数据集NewsCategoriesDataset-noorsaeed

    2025年4月24日   

    新闻分类数据集NewsCategoriesDataset-noorsaeed 数据来源:互联网公开数据 标签:新闻,分类,文本分析,自然语言处理,机器学习,数据集,新闻报道,文本挖掘 数据概述: 该数据集包含了来自不同新闻来源的新闻文章,旨在用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间范围为2016年至2017年。...
    packageimg
  • 用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi

    2025年4月24日   

    用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi 数据来源:互联网公开数据 标签:用户问题,数据集,数据分析,机器学习,自然语言处理,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自用户问题的数据,记录了用户提出的问题及相关信息。主要特征如下:...
    packageimg
  • 自然语言处理推文数据集NLPTweetDataset-muhammadtakytahmid

    2025年4月24日   

    自然语言处理推文数据集NLPTweetDataset-muhammadtakytahmid 数据来源:互联网公开数据 标签:自然语言处理,文本分析,社交媒体,情感分析,机器学习,数据挖掘,情感计算,文本分类 数据概述: 该数据集包含来自社交媒体平台推文的数据,记录了用户在推文中的文本内容及相关标签。主要特征如下:...
    packageimg
  • 产品评论分析比较数据集ProductReviewAnalysisComparisonDataset-aslemimolu

    2025年4月24日   

    产品评论分析比较数据集ProductReviewAnalysisComparisonDataset-aslemimolu 数据来源:互联网公开数据 标签:产品评论,数据集,文本分析,情感分析,自然语言处理,机器学习,消费者行为,市场研究 数据概述: 该数据集包含来自多个电商平台的产品评论数据,记录了消费者对不同产品的评价和反馈。主要特征如下:...
    packageimg
  • 保加利亚文章关键词数据集

    2025年4月24日   

    保加利亚文章关键词数据集 数据来源:互联网公开数据 标签:保加利亚文章,关键词提取,文本分析,自然语言处理,GPT预训练,文本摘要 数据概述: 本数据集包含一个CSV文件(kw-dataset.csv),记录了多篇保加利亚文章的标题、正文及其对应的关键词。每条数据包括以下字段: - title(文章标题):展示文章的核心主题。 -...
    packageimg
  • 阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21

    2025年4月24日   

    阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:...
    packageimg
  • 词义消歧数据集WSDData-abdelrahmanelbakouri

    2025年4月24日   

    词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,...
    packageimg
  • 推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji

    2025年4月24日   

    推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji 数据来源:互联网公开数据 标签:推特,情感分析,阿尔巴尼亚,社交媒体,NLP,自然语言处理,文本分析,数据集 数据概述: 该数据集包含了来自阿尔巴尼亚地区的推特数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • 医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan

    2025年4月24日   

    医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan 数据来源:互联网公开数据 标签:情绪分析,医疗会议,数据集,自然语言处理,文本分析,医疗研究,机器学习,情感识别 数据概述:...
    packageimg
  • 代码托管平台源代码词汇特征数据集-nompamh

    2025年4月24日   

    代码托管平台源代码词汇特征数据集-nompamh 数据来源:互联网公开数据 标签:源代码,词汇特征,自然语言处理,机器学习,代码分析,软件工程,数据集,文本分析 数据概述: 该数据集包含来自代码托管平台(如GitHub)的源代码数据,记录了源代码的词汇特征信息。主要特征如下: 时间跨度:数据记录的时间范围取决于源代码的更新时间,通常涵盖多个时间段。...
    packageimg
  • 电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26

    2025年4月24日   

    电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26 数据来源:互联网公开数据 标签:电影评论,社交媒体,数据集,用户行为,文本分析,情感分析,自然语言处理,电影研究 数据概述: 该数据集包含来自Reddit平台的电影讨论数据,主要记录了用户对电影《复仇者联盟》系列的评价和讨论内容。主要特征如下:...
    packageimg
  • 近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206

    2025年4月24日   

    近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,流行文化,机器学习,网络行为,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Reddit平台的近期帖子数据,记录了用户发布的文本内容,互动情况等信息。主要特征如下:...
    packageimg
  • 人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara

    2025年4月24日   

    人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:...
    packageimg
  • 恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k

    2025年4月24日   

    恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k 数据来源:互联网公开数据 标签:恶意软件,文本分析,数据集,自然语言处理,安全研究,威胁情报,恶意代码,机器学习 数据概述: 该数据集包含来自各种恶意软件样本的文本数据,旨在促进对恶意软件行为和特征的分析。主要特征如下:...
    packageimg
  • Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein

    2025年4月24日   

    Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein 数据来源:互联网公开数据 标签:社交媒体,书籍,讨论,数据集,文本分析,自然语言处理,情感分析,内容推荐 数据概述:...
    packageimg
  • 阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi

    2025年4月24日   

    阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi 数据来源:互联网公开数据 标签:序列标注,自然语言处理,数据集,命名实体识别,机器学习,语言处理,NLP,文本分析 数据概述: 该数据集包含阿拉伯语的序列标注数据,采用IOB标注格式记录了文本中的命名实体。主要特征如下:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul

    2025年4月24日   

    Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul 数据来源:互联网公开数据 标签:在线教育,课程描述,数据集,自然语言处理,机器学习,教育技术,文本分析,课程分类 数据概述: 该数据集包含来自Udemy平台的课程描述数据,记录了2022年平台上部分课程的详细信息。主要特征如下:...
    packageimg
  • IMDB电影评论数据集2011-2017年-ivancanepa

    2025年4月24日   

    IMDB电影评论数据集2011-2017年-ivancanepa 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本分析,娱乐研究,社会学 数据概述:该数据集包含来自IMDB的50,000条电影评论,记录了用户对电影的感受和评价。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2017年。...
    packageimg