找到5,827个数据集

标签: 文本分析

过滤结果
  • Bootstrap100问题200题集语气变化数据集20240319-asalan

    2025年4月25日   

    Bootstrap100问题200题集语气变化数据集20240319-asalan 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,语气识别,机器学习,文本挖掘,语言学,数据分析 数据概述:该数据集包含来自Bootstrap项目的100个问题,每个问题有200个不同语气变化的题集记录,适用于语气识别和文本分析等任务。主要特征如下:...
    packageimg
  • 垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u

    2025年4月25日   

    垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,电子邮件,文本分类,自然语言处理,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开邮箱的垃圾邮件(Spam)和正常邮件(Ham)数据,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • 阿拉伯语拼写数据集SpellArabicDataset-twproject

    2025年4月25日   

    阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
    packageimg
  • 印度金融新闻标题数据集2015-2023-iamdhruval

    2025年4月25日   

    印度金融新闻标题数据集2015-2023-iamdhruval 数据来源:互联网公开数据 标签:金融新闻,印度,文本分析,自然语言处理,新闻标题,情感分析,数据集,财经 数据概述: 该数据集包含了来自互联网的印度金融新闻标题,记录了印度金融领域的新闻头条信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2023年。...
    packageimg
  • BBC新闻数据集BBCNewsDataset-shineucc

    2025年4月25日   

    BBC新闻数据集BBCNewsDataset-shineucc 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,媒体研究,情感分析,信息检索 数据概述:该数据集包含来自BBC新闻网站的新闻文章数据,记录了不同类别新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 推特验证数据集TwitterValidationsDataset-thealpha22

    2025年4月25日   

    推特验证数据集TwitterValidationsDataset-thealpha22 数据来源:互联网公开数据 标签:社交媒体,数据集,用户验证,机器学习,文本分析,数据分析,社交媒体分析,信息验证 数据概述: 该数据集包含来自推特的用户验证数据,记录了用户账户的验证状态及相关信息。主要特征如下:...
    packageimg
  • 伊姆兰-汗推特数据集ImranKhanTweetsDataset-shankhl

    2025年4月25日   

    伊姆兰-汗推特数据集ImranKhanTweetsDataset-shankhl 数据来源:互联网公开数据 标签:推特数据,社交媒体,政治,人物,文本分析,自然语言处理,舆情分析,巴基斯坦 数据概述: 该数据集包含了关于伊姆兰·汗在推特上的相关推文数据。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体起始和结束时间取决于数据集的创建时间。...
    packageimg
  • Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr

    2025年4月25日   

    Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr 数据来源:互联网公开数据 标签:在线教育,数据集,课程信息,机器学习,自然语言处理,文本分析,数据挖掘,教育科技 数据概述: 该数据集包含了Udemy平台上付费课程的详细信息,旨在为研究人员和数据分析师提供关于在线教育领域的全面数据。主要特征如下:...
    packageimg
  • Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc

    2025年4月25日   

    Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc 数据来源: 互联网公开数据 标签: 问答系统,自然语言处理,数据集,机器学习,文本分析,语义理解,深度学习,人工智能 数据概述: 该数据集源自斯坦福大学的 SQuAD 2020 项目,专注于问答系统的训练和评估。主要特征如下:...
    packageimg
  • 数字民族志数据集DigitalEtnoDataset-fredenni

    2025年4月25日   

    数字民族志数据集DigitalEtnoDataset-fredenni 数据来源:互联网公开数据 标签:民族志,数字人文,数据集,文化研究,社交媒体,文本分析,情感分析,人类学 数据概述: 该数据集包含来自数字民族志研究的数据,记录了不同文化背景下人们在社交媒体上的互动和表达。主要特征如下: 时间跨度:...
    packageimg
  • 抑郁症社交媒体数据集DepressionSocialMediaDataset-sogolsheydaei

    2025年4月25日   

    抑郁症社交媒体数据集DepressionSocialMediaDataset-sogolsheydaei 数据来源:互联网公开数据 标签:抑郁症,社交媒体,数据分析,心理健康,机器学习,情绪识别,文本分析,社会科学研究 数据概述: 该数据集包含来自社交媒体平台的用户发帖内容,用于研究抑郁症的检测与分析。主要特征如下:...
    packageimg
  • 简历信息预测数据集ResumeInformationPredictionDataset-maujmishra

    2025年4月25日   

    简历信息预测数据集ResumeInformationPredictionDataset-maujmishra 数据来源:互联网公开数据 标签:简历,预测,数据集,自然语言处理,机器学习,招聘,求职,文本分析 数据概述: 该数据集包含简历信息数据,用于简历分析与预测任务。主要特征如下: 时间跨度:...
    packageimg
  • Jigsaw提交数据集JigsawSubmitsDataset-chiragpritmani

    2025年4月25日   

    Jigsaw提交数据集JigsawSubmitsDataset-chiragpritmani 数据来源:互联网公开数据 标签:机器学习,数据集,竞赛数据,文本分析,自然语言处理,情感分析,数据挖掘,深度学习 数据概述: 该数据集包含来自Jigsaw竞赛的提交数据,记录了竞赛参与者提交的模型结果和文本数据。主要特征如下:...
    packageimg
  • Reddit投资讨论数据分析数据集RedditInvestingDiscussionsDataset-vimalpillai

    2025年4月25日   

    Reddit投资讨论数据分析数据集RedditInvestingDiscussionsDataset-vimalpillai 数据来源:互联网公开数据 标签:投资,Reddit,社交媒体,文本分析,情感分析,金融,数据集,机器学习 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas

    2025年4月25日   

    社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:...
    packageimg
  • 性别与姓名关联数据集GenderandNameAssociationDataset-max1mum

    2025年4月25日   

    性别与姓名关联数据集GenderandNameAssociationDataset-max1mum 数据来源:互联网公开数据 标签:性别分析,姓名研究,数据集,人口统计,机器学习,社会研究,文本分析,数据分析 数据概述: 该数据集包含性别与姓名的关联数据,记录了不同姓名对应的性别信息。主要特征如下:...
    packageimg
  • 国家数据科学挑战赛NDSC第一届数据集-christiandaomara

    2025年4月25日   

    国家数据科学挑战赛NDSC第一届数据集-christiandaomara 数据来源:互联网公开数据 标签:数据科学,竞赛数据集,机器学习,文本分析,社交媒体,自然语言处理,情感分析,用户行为 数据概述: 该数据集是国家数据科学挑战赛(NDSC)第一届比赛所使用的数据集,主要包含社交媒体数据,用于多方面的分析和建模任务。主要特征如下:...
    packageimg
  • 新闻文章内容相似度分析矩阵数据集-manishkumar866115

    2025年4月25日   

    新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。...
    packageimg
  • 密码破译数据集CipherDataset-tarunjaikumar

    2025年4月25日   

    密码破译数据集CipherDataset-tarunjaikumar 数据来源:互联网公开数据 标签:密码学,数据集,文本分析,机器学习,自然语言处理,信息安全,密码破译,编码 数据概述: 该数据集包含用于密码破译的各种加密文本和相应的明文,用于研究和训练密码破译算法。主要特征如下: 时间跨度:数据涵盖了不同时期和类型的加密文本。...
    packageimg
  • 音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi

    2025年4月25日   

    音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,音频分析,文本分析,机器学习,音乐信息检索 数据概述: 该数据集包含音乐旋律和歌词数据,旨在用于音乐与歌词相关的研究和应用。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据集的构成。...
    packageimg