找到5,803个数据集

标签: 文本分析

过滤结果
  • 仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7

    2025年5月30日   

    仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7 数据来源:互联网公开数据 标签:仇恨言论,攻击性语言,数据集,文本分析,自然语言处理,社交媒体分析,社会学,道德研究...
    packageimg
  • 多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules

    2025年5月30日   

    多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...
    packageimg
  • 自然语言处理分类模型微调数据集LLM分类模型微调数据集-lonnieqin

    2025年5月30日   

    自然语言处理分类模型微调数据集LLM分类模型微调数据集-lonnieqin 数据来源:互联网公开数据 标签:自然语言处理,分类模型,深度学习,CNN模型,微调,文本分析,机器学习,数据集 数据概述: 该数据集主要用于自然语言处理分类模型的微调,特别是卷积神经网络(CNN)模型的应用。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • Naver博客文章搜索结果数据集NaverBlogSearchResultsDataset-wysohn2

    2025年5月30日   

    Naver博客文章搜索结果数据集NaverBlogSearchResultsDataset-wysohn2 数据来源:互联网公开数据 标签:博客,搜索,数据集,自然语言处理,文本分析,韩国,社交媒体,信息检索 数据概述: 该数据集包含来自Naver博客的搜索结果数据,记录了用户在Naver博客平台上进行的搜索查询及其相关的文章信息。主要特征如下:...
    packageimg
  • 写作行为与质量竞赛数据集-parkchoeun

    2025年5月30日   

    写作行为与质量竞赛数据集-parkchoeun 数据来源:互联网公开数据 标签:写作行为,写作质量,数据集,文本分析,自然语言处理,机器学习,竞赛,教育 数据概述: 该数据集包含来自写作行为与质量竞赛的数据,记录了参赛者的写作行为和作品质量。主要特征如下: 时间跨度:数据记录的时间范围为竞赛期间。 地理范围:数据覆盖了参与竞赛的全球用户。...
    packageimg
  • 印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan

    2025年5月30日   

    印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 文本分析 数据概述: 该数据集包含来自互联网的印地语-...
    packageimg
  • 人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07

    2025年5月30日   

    人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07 数据来源:互联网公开数据 标签:人物传记, 文本数据, 维基百科, 自然语言处理, 文本分析, 传记信息, 知识图谱, 信息检索 数据概述:...
    packageimg
  • 推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch

    2025年5月30日   

    推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,自然语言处理,机器学习,文本分析,舆情分析,NLP 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • 问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw

    2025年5月30日   

    问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw 数据来源:互联网公开数据 标签:问题回答, 质量评估, 预测模型, 文本分析, 机器学习, 自然语言处理, 问答系统, 深度学习 数据概述:...
    packageimg
  • 淋巴细胞白血病文章数据集-javeria

    2025年5月30日   

    淋巴细胞白血病文章数据集-javeria 数据来源:互联网公开数据 标签:白血病,淋巴细胞,医学,数据集,文本分析,自然语言处理,疾病研究,学术文献 数据概述:该数据集包含来自PubMed的关于淋巴细胞白血病(Lymphoblastic Leukemia)的医学文章数据,记录了相关疾病的研究、治疗和临床试验信息。主要特征如下:...
    packageimg
  • 垃圾文本识别数据集RubbishTextDataset-sokoface

    2025年5月30日   

    垃圾文本识别数据集RubbishTextDataset-sokoface 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,垃圾信息过滤,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集包含来自互联网的垃圾文本数据,记录了各种形式的垃圾信息,如广告、诈骗、低俗内容等。主要特征如下:...
    packageimg
  • 向量化文本处理数据集VectorisedTextDataset-rhianarmstrong

    2025年5月30日   

    向量化文本处理数据集VectorisedTextDataset-rhianarmstrong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,向量化,深度学习,信息检索 数据概述: 该数据集包含来自互联网的文本数据,经过向量化处理,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • Alura词向量数据集AluraWord2VecDataset-romariogomesbr

    2025年5月30日   

    Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
    packageimg
  • 联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge

    2025年5月30日   

    联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge 数据来源:互联网公开数据 标签:联合国,演讲,数据集,文本分析,自然语言处理,政治研究,国际关系,多语言文本 数据概述: 该数据集包含来自联合国大会的演讲记录,经过处理后适用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:...
    packageimg
  • GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem

    2025年5月30日   

    GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem 数据来源:互联网公开数据 标签:软件开发,问题追踪,数据集,自然语言处理,文本分析,开源项目,机器学习,代码管理 数据概述:该数据集包含来自GitHub的开源项目的问题追踪数据,记录了开发者在项目开发过程中遇到的问题、讨论和解决方案。主要特征如下:...
    packageimg
  • 作弊检测数据集CheatingDetectionDataset-rahimatanveer1

    2025年5月30日   

    作弊检测数据集CheatingDetectionDataset-rahimatanveer1 数据来源:互联网公开数据 标签:作弊检测,数据集,教育,学术诚信,机器学习,数据分析,文本分析,行为分析 数据概述: 该数据集包含了用于作弊检测的数据,旨在帮助识别和预防学术不端行为。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个学期和考试周期。...
    packageimg
  • 股票市场情绪分析验证数据集StockMarketSentimentAnalysisValidationDataset-kunihikofurugori

    2025年5月30日   

    股票市场情绪分析验证数据集StockMarketSentimentAnalysisValidationDataset-kunihikofurugori 数据来源:互联网公开数据 标签:股票市场, 情绪分析, 文本分析, 自然语言处理, 情感分类, 验证集, 金融科技, 数据集 数据概述:...
    packageimg
  • 垃圾邮件与正常邮件数据集CombinedSpamandHamEmailDataset-mlane43210

    2025年5月30日   

    垃圾邮件与正常邮件数据集CombinedSpamandHamEmailDataset-mlane43210 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,电子邮件 数据概述: 该数据集整合了垃圾邮件和正常邮件的文本内容,用于邮件分类、垃圾邮件检测等任务。主要特征如下:...
    packageimg
  • 乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek

    2025年5月30日   

    乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek 数据来源:互联网公开数据 标签:乌兹别克语,问答,自然语言处理,数据集,文本分析,机器翻译,语言学,人工智能 数据概述: 该数据集包含乌兹别克语的问答对,旨在促进乌兹别克语的自然语言处理研究和应用。主要特征如下: 时间跨度:数据收集时间不限,持续更新。...
    packageimg
  • 斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261

    2025年5月30日   

    斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:...
    packageimg