找到5,805个数据集

标签: 文本分析

过滤结果
  • 新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford

    2025年5月29日   

    新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford 数据来源:互联网公开数据 标签:新冠疫情, 文本分析, 主题模型, LDA, 新闻文章, 疫情传播, 舆情分析, 数据可视化 数据概述: 该数据集包含来自新闻媒体关于新冠疫情的报道文章,记录了文章内容及其主题分布。主要特征如下:...
    packageimg
  • 社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab

    2025年5月29日   

    社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。...
    packageimg
  • 问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy

    2025年5月29日   

    问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:...
    packageimg
  • 知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet

    2025年5月29日   

    知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet 数据来源:互联网公开数据 标签:知识问答, 自然语言处理, 上下文理解, 文本分析, 多选题, 机器学习, 数据集, 语料库 数据概述:...
    packageimg
  • 政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet

    2025年5月29日   

    政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet 数据来源:互联网公开数据 标签:政治新闻, 文本分析, 新闻分类, 舆情分析, 自然语言处理, 文本挖掘, 时事评论, 机器学习 数据概述: 该数据集包含来自互联网的政治新闻文章,记录了标题、正文、主题和日期等信息。主要特征如下:...
    packageimg
  • 语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau

    2025年5月29日   

    语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau 数据来源:互联网公开数据 标签:自然语言处理,Python,语言工具,数据集,语法检查,文本分析,机器学习,软件开发 数据概述: 该数据集包含LanguageTool Python...
    packageimg
  • 印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar

    2025年5月29日   

    印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar 数据来源:互联网公开数据 标签:新闻,头条,印度,自然语言处理,文本分析,情感分析,时事,数据集 数据概述: 该数据集包含了来自印度新闻网站的头条新闻标题,记录了印度新闻媒体报道的时事新闻。主要特征如下:...
    packageimg
  • 学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal

    2025年5月29日   

    学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:...
    packageimg
  • 客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx

    2025年5月29日   

    客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx 数据来源:互联网公开数据 标签:客户服务, 风险评估, 文本分析, 对话分析, 机器学习, 情感分析, 风险预测, 数据标注 数据概述:...
    packageimg
  • 社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777

    2025年5月29日   

    社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 自然语言处理, 情感分类, 用户行为, 数据挖掘, 情绪识别 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,记录了用户发布的内容及其对应的情感极性。主要特征如下:...
    packageimg
  • 乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa

    2025年5月29日   

    乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,内容挖掘,新闻研究,语言技术 数据概述: 该数据集包含来自乌克兰的新闻文章数据,记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下:...
    packageimg
  • 英国经济战略政策文件词频数据集-adammuhtar

    2025年5月29日   

    英国经济战略政策文件词频数据集-adammuhtar 数据来源:互联网公开数据 标签:经济政策,文本分析,词频统计,英国,政策文件,自然语言处理,文本挖掘,经济学,数据集 数据概述: 该数据集包含来自英国政府经济战略政策文件的词频统计数据,旨在分析和研究英国经济政策的语言特征和主题分布。主要特征如下:...
    packageimg
  • 光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot

    2025年5月29日   

    光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot 数据来源:互联网公开数据 标签:OCR, 图像识别, 文本提取, 计算机视觉, 深度学习, 数据标注, 文本分析, 多角度文本 数据概述:...
    packageimg
  • 澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian

    2025年5月28日   

    澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 时间序列分析, 舆情分析, 澳大利亚, 数据挖掘, 情感分析 数据概述: 该数据集包含来自澳大利亚广播公司(ABC...
    packageimg
  • 安然公司电子邮件数据集EnronEmailDataset-napisarchuk

    2025年5月28日   

    安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,金融,腐败,社交网络,信息检索 数据概述: 该数据集包含来自美国安然公司(Enron Corporation)员工的电子邮件,记录了该公司在破产前的大量内部通信。主要特征如下:...
    packageimg
  • 洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber

    2025年5月28日   

    洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,新闻媒体,虚假信息,信息传播 数据概述: 该数据集包含来自“洋葱新闻”(The...
    packageimg
  • 文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal

    2025年5月28日   

    文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,词频统计,向量化,机器学习,数据挖掘,文本分类 数据概述: 该数据集包含经过预处理的文本数据,用于文本数据的统计分析和向量化表示。主要特征如下: 时间跨度:...
    packageimg
  • 提交转换数据集SubmissionTransformerDataset-godgod3

    2025年5月28日   

    提交转换数据集SubmissionTransformerDataset-godgod3 数据来源:互联网公开数据 标签:提交数据,数据转换,数据集,自然语言处理,机器学习,文本分析,编程,软件开发 数据概述:该数据集来自开源项目,记录了代码提交信息及其转换后的文本描述,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 俄罗斯1985年至2023年4万首歌曲数据集-anastasiadrozhzhina

    2025年5月28日   

    俄罗斯1985年至2023年4万首歌曲数据集-anastasiadrozhzhina 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,文化研究,音乐历史,社会学 数据概述: 该数据集包含来自俄罗斯的1985年至2023年的4万首歌曲的歌词数据,记录了这些歌曲的详细信息。主要特征如下:...
    packageimg
  • 高精度文本分类测试数据集HiBETestTextDataset-siddharthyadavv

    2025年5月28日   

    高精度文本分类测试数据集HiBETestTextDataset-siddharthyadavv 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,数据挖掘,人工智能,文本分析,机器阅读 数据概述: 该数据集包含来自多个领域的文本数据,专注于高精度文本分类和机器学习模型的评估。主要特征如下:...
    packageimg