找到237个数据集

标签: 文本标注

过滤结果
  • 阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta

    2025年4月25日   

    阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,多类别分类,文本标注,社交媒体,阿萨姆语,人工智能 数据概述:...
    packageimg
  • 标注训练序列描述数据集AnnotatedTrainSeriesDescriptionsDataset-llleeeoooh

    2025年4月24日   

    标注训练序列描述数据集AnnotatedTrainSeriesDescriptionsDataset-llleeeoooh 数据来源:互联网公开数据 标签:列车描述,数据集,自然语言处理,文本标注,机器学习,交通分析,铁路系统,文本挖掘 数据概述:该数据集包含来自多个来源的标注了列车序列的详细描述数据,适用于自然语言处理和文本分析等任务。主要特征如下:...
    packageimg
  • Spacy自然语言处理研究数据集-dsfelix

    2025年4月24日   

    Spacy自然语言处理研究数据集-dsfelix 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,Spacy,语言模型,文本标注,机器学习,NLP 数据概述: 该数据集包含了用于Spacy自然语言处理研究的多个数据集,涵盖了广泛的NLP任务。主要特征如下: 时间跨度:...
    packageimg
  • 数据2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh

    2025年4月24日   

    2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh 数据来源:互联网公开数据 标签:多语言模型,自然语言处理,数据集,机器学习,文本标注,基准测试,人工智能,语言技术 数据概述: 该数据集由2025年大规模多语言模型基准(MMLM...
    packageimg
  • 歌词标注数据集LyricsMarkupDataset-idwntl

    2025年4月23日   

    歌词标注数据集LyricsMarkupDataset-idwntl 数据来源:互联网公开数据 标签:歌词,数据集,文本标注,自然语言处理,音乐分析,文化研究,词频分析,情感分析 数据概述: 该数据集包含来自互联网的歌词文本,记录了各种歌曲的歌词及其标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
    packageimg
  • 测试数据标注数据集-dong6854

    2025年4月22日   

    测试数据标注数据集-dong6854 数据来源:互联网公开数据 标签:数据标注,图像标注,文本标注,数据集,机器学习,计算机视觉,自然语言处理,人工智能 数据概述: 该数据集包含用于测试数据标注任务的各种数据样本,旨在评估和改进标注工具,标注流程和标注质量。主要特征如下: 时间跨度: 数据集的时间跨度取决于具体的数据样本,涵盖不同时间段的图像,文本等。...
    packageimg
  • Politifact假新闻分析数据集1963-2021-vaibhavsuman

    2025年4月22日   

    Politifact假新闻分析数据集1963-2021-vaibhavsuman 数据来源:互联网公开数据 标签:假新闻,分析,政治,媒体,文本标注,数据集,事实核查,专家评审 数据概述:...
    packageimg
  • 教学用NLP问答任务用标准训练语料数据集

    2025年4月21日   

    教学用NLP问答任务用标准训练语料数据集 数据来源:互联网公开数据 数据概述: 该数据集原始版本由第三方作者发布,最初以 JSON 格式提供,需通过自定义数据加载器解析。本数据集由当前整理者转换为 可直接使用的 CSV 格式,以方便在监督学习任务中使用。原始数据作者信息可通过提供的链接查阅。 数据内容:...
    packageimg
  • 伦巴第语命名实体识别与语言训练数据集

    2025年4月17日   

    伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...
    packageimg
  • 土耳其地震推文数据集

    2025年4月17日   

    土耳其地震推文数据集 数据来源:互联网公开数据 标签:地震,推文,紧急呼吁,救援,文本标注,BERT模型,自然语言处理,社会应急响应 数据概述: 本数据集包含2020年伊兹密尔地震发生后,与地震相关的土耳其推文数据,主要分为三个部分: 1....
    packageimg
  • 罗马-乌尔都语情感分析标注数据集

    2025年4月15日   

    罗马-乌尔都语情感分析标注数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,情感分析,文本标注,自然语言处理,机器学习 数据概述: 本数据集是Kaggle上已有的“Roman Urdu Sentiment Analysis”数据集的清理版本,由S....
    packageimg
  • 命名实体识别数据集

    2025年4月15日   

    命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,预训练语言模型,文本标注,机器学习,数据科学,Kaggle数据集 数据概述: 本数据集主要用于运行基于预训练语言模型的命名实体识别(NER)任务的笔记本。数据集包含三个关键字段:1. 文本内容(Text),2. 实体标注(Labels),3....
    packageimg
  • 基于16个表情符号的推特情感分析数据集

    2025年4月15日   

    基于16个表情符号的推特情感分析数据集 数据来源:互联网公开数据 标签:推特,情感分析,表情符号,文本标注,情绪识别,社交媒体分析 数据概述:...
    packageimg
  • 说服力与论点分析综合数据集

    2025年4月15日   

    说服力与论点分析综合数据集 数据来源:互联网公开数据 标签:说服力,论点分析,文本标注,机器学习,教育评估,写作反馈,评分模型 数据概述:...
    packageimg
  • 德国仇恨言论语料库

    2025年4月14日   

    德国仇恨言论语料库 数据来源:互联网公开数据 标签:仇恨言论,德语,社交网络,文本标注,自然语言处理,内容识别,社会媒体分析 数据概述:...
    packageimg
  • 数据2019印度板球联赛IPL比赛评论数据集

    2025年4月14日   

    数据2019印度板球联赛IPL比赛评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度板球联赛,IPL,实时评论,比赛分析,NLP,文本标注,体育数据 数据概述 本数据集包含2019年印度板球联赛(IPL)所有比赛的球级(ball-level)实时评论数据,以及比赛概要信息。数据来源于ESPN...
    packageimg
  • IBM辩论者和规则标记演讲中被强调的词语数据集

    2025年4月14日   

    IBM辩论者和规则标记演讲中被强调的词语数据集 数据来源:互联网公开数据 标签:IBM,辩论,演讲,文本标注,强调词语,自然语言处理,语音分析 数据概述:...
    packageimg