找到7个数据集

标签: 多语言模型

过滤结果
  • AUGUSTA语音转文本语言模型训练数据集

    2025年12月22日 30 202 60

    数据集概述 该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集,AUGUSTA是基于OpenAI Whisper定制的模型,可将南蒂罗尔方言语音转录为标准德语。 文件详解 文件名称: augusta_data-main.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 119 59

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • 罗曼语动词屈折数据集2_0_0

    2025年12月6日 30 170 70

    数据集概述 该数据集为罗曼语动词屈折数据集2.0.0,覆盖73种罗曼语变体,提供基于宽式IPA音位符号的动词范式形式,按同源关系组织词位与范式单元,补充拉丁语范式并以CLDF格式发布,支持语言演变研究与语言学假设验证。 文件详解 文件名称: v2.0.4.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 开放海象增强数据集

    2025年6月1日 30 7 2

    开放海象增强数据集 数据来源:互联网公开数据 标签:自动化评分,自然语言处理,深度学习,教育技术,GPT模型,数据增强,模型训练,机器学习评估,多语言模型,教育分析 数据概述:...
    packageimg
  • 数据2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh

    2025年4月24日 30 24 5

    2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh 数据来源:互联网公开数据 标签:多语言模型,自然语言处理,数据集,机器学习,文本标注,基准测试,人工智能,语言技术 数据概述: 该数据集由2025年大规模多语言模型基准(MMLM...
    packageimg
  • 多语言情感分析数据集

    2025年4月19日 30 61 41

    多语言情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,多语言模型,文本分类,LLM生成,数据清洗 数据概述:...
    packageimg
  • 人工智能模型性能与数据规模关系研究数据集

    2025年2月24日 90 86 75

    标题:人工智能模型性能与数据规模关系研究数据集 数据内容: 该数据集包含了人工智能模型在知识测试任务中的性能表现及其与训练数据集大小之间的关系。数据集中的关键数据元素包括: 1. Entity:表示不同的人工智能模型或算法类型,共有25种不同的值。 2. Code:表示数据集的标识符或版本信息,仅有一种不同的值。 3....
    packageimg