找到5,805个数据集

标签: 文本分析

过滤结果
  • WorldStar视频评论数据集WorldStarCommentsDataset-dataranch

    2025年4月23日   

    WorldStar视频评论数据集WorldStarCommentsDataset-dataranch 数据来源:互联网公开数据 标签:视频评论,社交媒体,文本分析,情感分析,自然语言处理,数据集,舆情分析,用户行为 数据概述: 该数据集包含了来自WorldStarHipHop网站的视频评论数据,记录了用户对各类视频的评论内容。主要特征如下:...
    packageimg
  • Goodreads网站书籍信息抓取数据集-muhyusuf1112

    2025年4月23日   

    Goodreads网站书籍信息抓取数据集-muhyusuf1112 数据来源:互联网公开数据 标签:书籍,Goodreads,网络抓取,数据集,文学,评论,推荐,文本分析 数据概述:该数据集包含从 Goodreads 网站抓取的书籍信息,记录了书籍的详细描述和用户反馈。主要特征如下: 时间跨度:数据抓取时间为[具体时间,例如:2023年]。...
    packageimg
  • 地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr

    2025年4月23日   

    地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,位置识别,机器学习,信息提取,地理信息系统,命名实体识别 数据概述: 该数据集由Zindi平台提供,专注于识别文本中提及的地理位置信息。主要特征如下:...
    packageimg
  • 性别检测数据集GenderDetectionDataset-subhajournal

    2025年4月23日   

    性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:...
    packageimg
  • 用户行为与文本分析数据集多维度用户特征深度解析

    2025年4月23日   

    标题:用户行为与文本分析数据集多维度用户特征深度解析 数据内容:本数据集包含来自互联网公开数据的多维度用户信息,具体字段包括: - 用户标识(set_id):20种不同值,用于唯一标识用户 - 性别(gender):包括男性和女性两种类型 - 年龄(age):覆盖11个不同年龄段 - 国家(country):涉及8个不同国家 -...
    packageimg
  • 葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

    2025年4月23日   

    葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:...
    packageimg
  • 新闻数据集NewsDataOneDataset-sammyke

    2025年4月23日   

    新闻数据集NewsDataOneDataset-sammyke 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,信息检索,自然语言处理,机器学习,数据挖掘,新闻媒体 数据概述: 该数据集包含来自多个新闻媒体平台的数据,记录了各类新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 社交媒体数据科学推文互动分析数据集-2020至2022年-jhonny1201

    2025年4月23日   

    社交媒体数据科学推文互动分析数据集-2020至2022年-jhonny1201 数据来源:互联网公开数据 标签:数据科学,社交媒体,推文,Twitter,文本分析,用户互动,时间序列,情感分析 数据概述:...
    packageimg
  • Reddit金融新闻标题数据集RedditFinanceHeadlinesDataset-vantran1510

    2025年4月23日   

    Reddit金融新闻标题数据集RedditFinanceHeadlinesDataset-vantran1510 数据来源:互联网公开数据 标签:金融新闻,数据集,自然语言处理,文本分析,机器学习,情感分析,新闻标题,数据分析 数据概述: 该数据集包含来自Reddit平台的金融新闻标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:...
    packageimg
  • 词频统计数据集WordFrequenciesDataset-patricknormile

    2025年4月23日   

    词频统计数据集WordFrequenciesDataset-patricknormile 数据来源:互联网公开数据 标签:文本分析,词频统计,自然语言处理,数据集,数据挖掘,语言学,机器学习,文本预处理 数据概述: 该数据集包含来自多个文本来源的词频统计数据,记录了不同语料库中单词出现的频率。主要特征如下:...
    packageimg
  • 活动博客数据集Events-BlogDataset-sahilsaxenass

    2025年4月23日   

    活动博客数据集Events-BlogDataset-sahilsaxenass 数据来源:互联网公开数据 标签:博客,活动记录,数据集,文本分析,社交媒体,内容管理,机器学习,信息挖掘 数据概述: 该数据集包含来自博客平台的活动记录数据,记录了各类活动的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • Skytrax航空评论数据集SkytraxReviewsDataset-austinpeck

    2025年4月23日   

    Skytrax航空评论数据集SkytraxReviewsDataset-austinpeck 数据来源:互联网公开数据 标签:航空,旅客评论,数据集,情感分析,服务质量,数据挖掘,客户体验,文本分析 数据概述: 该数据集包含来自 Skytrax 网站的航空旅客评论数据,记录了乘客对不同航空公司的服务体验。主要特征如下:...
    packageimg
  • 韩国自然语言推理数据集1963-2021-thedevastator

    2025年4月23日   

    韩国自然语言推理数据集1963-2021-thedevastator 数据来源:互联网公开数据 标签:KOR_NLI,自然语言推理,韩语,文本分析,机器学习,自然语言处理,推理模型 数据概述:...
    packageimg
  • 电影剧情概述与类型关联分析数据集-hetpatel01

    2025年4月23日   

    电影剧情概述与类型关联分析数据集-hetpatel01 数据来源:互联网公开数据 标签:电影,类型,剧情,文本分析,自然语言处理,NLP,文本分类,推荐系统,多标签分类 数据概述:...
    packageimg
  • 抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru

    2025年4月23日   

    抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru 数据来源:互联网公开数据 标签:心理健康,抑郁症,数据集,社交网络,文本分析,机器学习,情感识别,自然语言处理 数据概述:...
    packageimg
  • 多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9

    2025年4月23日   

    多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,机器学习,深度学习,人工智能,文本分析 数据概述: 该数据集包含来自多个来源的多语言文本数据,专门用于自然语言推理任务。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir

    2025年4月23日   

    孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir 数据来源:互联网公开数据 标签:语言学,词汇,数据集,文本分析,自然语言处理,语言研究,机器学习,教育 数据概述: 该数据集包含来自孟加拉语词汇库的数据,记录了孟加拉语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit

    2025年4月23日   

    卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:...
    packageimg
  • 辩论场景句子数据集DebateSentencesDataset-vdudani

    2025年4月23日   

    辩论场景句子数据集DebateSentencesDataset-vdudani 数据来源:互联网公开数据 标签:辩论,句子,文本分析,自然语言处理,数据集,情感分析,语言学,机器学习 数据概述: 该数据集包含了从公开辩论场景中提取的句子,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的辩论场景。...
    packageimg
  • 柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana

    2025年4月23日   

    柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana 数据来源:互联网公开数据 标签:侦探小说,对话数据,数据集,自然语言处理,机器学习,文本分析,文化研究,推理小说 数据概述: 该数据集包含来自柯南(Detective...
    packageimg