找到33个数据集

标签: 多语言文本

过滤结果
  • 卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16

    2025年5月18日   

    卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:...
    packageimg
  • 欧盟议会文本标注数据集EUParliamentTextAnnotationDataset-julianschelb

    2025年4月29日   

    欧盟议会文本标注数据集EUParliamentTextAnnotationDataset-julianschelb 数据来源:互联网公开数据 标签:文本标注, 命名实体识别, 欧盟议会, 多语言文本, 政治文本分析, 自然语言处理, 机器学习, 文本分类 数据概述: 该数据集包含来自欧洲议会(European...
    packageimg
  • 多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013

    2025年4月29日   

    多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013 数据来源:互联网公开数据 标签:文本识别,多语言,语言分类,自然语言处理,机器翻译,文本分析,语料库,印度语 数据概述: 该数据集包含来自多种印度语言的文本片段,旨在用于语言识别任务。主要特征如下:...
    packageimg
  • 维基多语言文本分类数据集-2018

    2025年4月26日   

    维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日   

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365

    2025年4月25日   

    自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,机器学习,文本分析,人工智能,语言模型,语义理解 数据概述: 该数据集包含来自多个语言的自然语言处理数据,记录了不同语言的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss

    2025年4月25日   

    自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:...
    packageimg
  • 多语言定制数据集MultilingualCustomDataset-amarendradeo

    2025年4月24日   

    多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:...
    packageimg
  • 多语言标记数据集MultilangTokensDataset-pranav51286

    2025年4月23日   

    多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...
    packageimg
  • 印度2022州选举Twitter数据集

    2025年4月21日   

    印度2022州选举Twitter数据集 数据来源:互联网公开数据 标签:印度选举, Twitter数据, 政治观点分析, 结果预测, 多语言文本, 数据探索 数据概述:...
    packageimg
  • 多语言印地语NLP数据集

    2025年4月15日   

    多语言印地语NLP数据集 数据来源:互联网公开数据 标签:印地语NLP,自然语言处理,机器翻译,情感分析,命名实体识别,文本摘要,语言理解,多语言文本,新闻文章,社交媒体,对话文本 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日   

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 多语言文本检测与识别自然语言处理数据集

    2025年4月14日   

    多语言文本检测与识别自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言检测,语言识别,机器学习,文本分析,文化多样性,全球连接 数据概述:...
    packageimg