找到5,826个数据集

标签: 文本分析

过滤结果
  • 音乐资源数据集艺术家歌曲与文本信息汇总

    2025年4月25日   

    标题:音乐资源数据集艺术家、歌曲与文本信息汇总 数据内容: 该数据集包含音乐相关信息,具体包括以下字段: 1. 艺术家(artist):记录了643种不同的艺术家信息,涵盖了不同风格和流派的音乐人。 2. 歌曲(song):记录了44,824种不同的歌曲信息,展示了丰富的音乐作品。 3....
    packageimg
  • kun-uz新闻数据集

    2025年4月25日   

    kun-uz新闻数据集 数据来源:互联网公开数据 标签:新闻,乌兹别克斯坦,社会,经济,体育,科技,时事,分类,文本分析 数据概述:...
    packageimg
  • 命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03

    2025年4月25日   

    命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
    packageimg
  • 人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna

    2025年4月25日   

    人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna 数据来源:互联网公开数据 标签:社会偏见,数据集,文本分析,自然语言处理,机器学习,社会研究,伦理研究,偏见检测 数据概述: 该数据集来自Crows...
    packageimg
  • 明镜杂志中国报道数据集

    2025年4月25日   

    明镜杂志中国报道数据集 数据来源:互联网公开数据 标签:中国报道,德国媒体,文本分析,时间序列,新闻内容,国际关系,媒体研究 数据概述:...
    packageimg
  • 新闻深度处理数据集NewsDeepProcessedDataset-mario123475

    2025年4月25日   

    新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:...
    packageimg
  • 网络语言脏话数据集SwearTotalData-parkgarden

    2025年4月25日   

    网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 情感分析社交媒体数据集SentimentOutData20220929-darioceni

    2025年4月25日   

    情感分析社交媒体数据集SentimentOutData20220929-darioceni 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分析,自然语言处理,机器学习,社会研究,市场分析 数据概述:...
    packageimg
  • 俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina

    2025年4月25日   

    俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:...
    packageimg
  • 仇恨言论训练数据集HateTrain1Dataset-miguelbanda

    2025年4月25日   

    仇恨言论训练数据集HateTrain1Dataset-miguelbanda 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,社会研究,伦理研究 数据概述:该数据集来自互联网公开的社交媒体平台,记录了用户的评论和帖子内容,主要用于识别和分析仇恨言论。主要特征如下:...
    packageimg
  • 推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000

    2025年4月25日   

    推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000 数据来源:互联网公开数据 标签:文本分析,关键词提取,数据集,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自推特平台的文本数据,记录了推文内容的特征及其关键词提取结果。主要特征如下:...
    packageimg
  • 自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719

    2025年4月25日   

    自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,深度学习,文本分析,算法工具,人工智能,计算机科学 数据概述: 该数据集包含来自Transformers 4.6.0版本的数据,记录了自然语言处理和机器学习领域的工具包及模型信息。主要特征如下:...
    packageimg
  • 英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk

    2025年4月25日   

    英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk 数据来源:互联网公开数据 标签:聊天机器人,对话数据,自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能 数据概述: 该数据集包含了英语聊天机器人生成的对话数据,记录了用户与聊天机器人之间的交互内容。主要特征如下:...
    packageimg
  • 自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss

    2025年4月25日   

    自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:...
    packageimg
  • 个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu

    2025年4月25日   

    个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu 数据来源:互联网公开数据 标签:个人身份信息,数据集,隐私保护,自然语言处理,文本分析,机器学习,信息安全,数据保护 数据概述:该数据集包含用于训练个人身份信息(PII)检测模型的数据,记录了多种类型的文本数据及其标注的个人身份信息。主要特征如下:...
    packageimg
  • 阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals

    2025年4月25日   

    阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals 数据来源:互联网公开数据 标签:阿拉伯语,新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻分类,语言资源 数据概述: 该数据集包含来自沙特阿拉伯Sabq新闻网站的文章数据,记录了网站发布的阿拉伯语新闻报道。主要特征如下:...
    packageimg
  • Agoda酒店评论数据集-atulmittal199174

    2025年4月25日   

    Agoda酒店评论数据集-atulmittal199174 数据来源:互联网公开数据 标签:酒店,评论,数据集,文本分析,情感分析,旅游,自然语言处理,机器学习 数据概述: 该数据集包含来自Agoda网站的酒店评论数据,记录了用户对酒店的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围未知,具体时间跨度依赖于原始数据。...
    packageimg
  • 阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune

    2025年4月25日   

    阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯文化,民间故事,文本分析,自然语言处理,情感分析,语言学,文化研究,叙事学 数据概述:该数据集包含来自Raid项目收集的阿拉伯民间故事,记录了阿拉伯地区的各种民间故事和传说。主要特征如下:...
    packageimg
  • IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl

    2025年4月25日   

    IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,辩论,数据集,文本分析,语义理解,证据检索,信息抽取,人工智能 数据概述: 该数据集由IBM Debater项目提供,包含从大规模文本语料库中提取的辩论相关的证据句子。主要特征如下:...
    packageimg
  • 印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002

    2025年4月25日   

    印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本分析,印度新闻,数据集,机器翻译,文本分类,信息检索 数据概述: 该数据集包含来自Inshorts平台的印度新闻摘要数据,用于文本摘要,自然语言处理等任务。主要特征如下:...
    packageimg