找到19个数据集

标签: 多语言支持

过滤结果
  • 教育领域数据库及说明文档

    2025年12月21日 30 159 73

    数据集概述 该数据集基于联合国教科文组织国际教育标准分类(ISCED-F),包含120个标准教育领域分类及编码,覆盖34种语言,提供搜索树界面用于受访者导航分类,支持计算机辅助调查的自识别及开放回答的后编码。 文件详解 数据文件:...
    packageimg
  • ARASAAC彩色象形图第5部分

    2025年12月9日 30 73 3

    数据集概述 该数据集为ARASAAC项目的一部分,包含一千张由Sergio Palao创建的黑白象形图,涵盖医疗、生物、实验等主题,以PNG格式存储,无目录结构与文件分割。 文件详解...
    packageimg
  • 阿拉伯文脚本网页浏览器支持测试文件

    2025年12月8日 30 77 34

    数据集概述 该数据集包含一个基础HTML文件,用于测试网页浏览器对HTML5中@lang属性的支持程度,重点验证阿拉伯文脚本的显示效果,为网页国际化与多语言兼容性测试提供基础工具。 文件详解 文件名称: test_lang.html 文件格式: HTML (.html) 核心内容:...
    packageimg
  • 文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95

    2025年5月30日 30 157 28

    文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95 数据来源:互联网公开数据 标签:语言校对, 文本纠错, 自然语言处理, 多语言支持, 词汇校正, 语法检查, 数据集, 语言学 数据概述:...
    packageimg
  • 马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111

    2025年5月29日 30 186 42

    马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111 数据来源:互联网公开数据 标签:马拉雅拉姆字符,数据集,语言学,字符识别,机器学习,自然语言处理,学术资源,多语言支持 数据概述: 该数据集包含来自互联网公开资源的马拉雅拉姆字符集,记录了马拉雅拉姆语的各种字符及其相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan

    2025年5月28日 30 109 32

    大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:...
    packageimg
  • 大规模语言检测数据集

    2025年5月5日 30 10 6

    大规模语言检测数据集 数据来源:互联网公开数据 标签:语言检测,ISO 639-3,自然语言处理,多语言支持,文本分析,语言识别,机器学习 数据概述: 本数据集包含一个约10^7行的.csv文件,每行记录包含一个句子及其对应的ISO 639-3语言代码。此外,数据集还包括一个.json文件,用于映射ISO...
    packageimg
  • 多语言翻译应用性能评估数据集

    2025年4月26日 30 100 50

    多语言翻译应用性能评估数据集 数据来源:互联网公开数据 标签:翻译应用,多语言支持,翻译质量,用户评价,性能评估,自然语言处理,机器学习 数据概述:...
    packageimg
  • Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker

    2025年4月26日 30 172 145

    Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker 数据来源:互联网公开数据 标签:Flickr, 邦加拉语, 图像标注, 数据集, 机器学习, 自然语言处理, 图像识别, 多语言支持 数据概述: 该数据集包含来自 Flickr 30K 数据集的图像和其对应的邦加拉语描述。主要特征如下:...
    packageimg
  • 维基媒体语言类别名称数据集WikimediaNamesbyLanguageCategoriesDataset-jamesxiwoolley

    2025年4月25日 30 3 0

    维基媒体语言类别名称数据集WikimediaNamesbyLanguageCategoriesDataset-jamesxiwoolley 数据来源:互联网公开数据 标签:维基媒体,语言类别,名称数据,数据集,文本分析,自然语言处理,多语言支持,文化研究 数据概述: 该数据集包含来自维基媒体的数据,记录了不同语言类别下的名称信息。主要特征如下:...
    packageimg
  • 英西语翻译数据集English-SpanishTranslationDataset-nouranader

    2025年4月24日 30 134 100

    英西语翻译数据集English-SpanishTranslationDataset-nouranader 数据来源:互联网公开数据 标签:翻译,语言学,数据集,机器学习,自然语言处理,文本分析,多语言支持,语言学习 数据概述:该数据集包含来自互联网的英西语翻译数据,记录了英语和西班牙语之间的文本对应关系。主要特征如下:...
    packageimg
  • 评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906

    2025年4月23日 30 27 7

    评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906 数据来源:互联网公开数据 标签:评论数据,数据集,翻译测试,自然语言处理,文本分析,机器学习,多语言支持,质量检查...
    packageimg
  • 矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir

    2025年4月23日 30 108 18

    矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir 数据来源:互联网公开数据 标签:自然语言处理,矛盾检测,数据集,人工智能,机器学习,文本分析,情感分析,多语言支持 数据概述: 该数据集为Contradictory My Dear...
    packageimg
  • 布哈里与穆斯林圣训数据集

    2025年4月19日 30 57 28

    布哈里与穆斯林圣训数据集 数据来源:互联网公开数据 标签:圣训,布哈里,穆斯林,孟加拉语,英语,宗教研究,文本分析,多语言支持 数据概述:...
    packageimg
  • 环球影城游客评价数据集

    2025年4月19日 30 165 2

    环球影城游客评价数据集 数据来源:互联网公开数据 标签:环球影城,游客评价,情感分析,用户反馈,主题公园,满意度,评论分析,多语言支持 数据概述:...
    packageimg
  • 欧洲语言词库数据集

    2025年4月19日 30 75 9

    欧洲语言词库数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言支持,词库,欧洲语言,文本分析,语言学习,编码支持 数据概述...
    packageimg
  • 全球流行音乐歌词与艺术家数据集1963-2021

    2025年4月15日 30 87 57

    全球流行音乐歌词与艺术家数据集1963-2021 数据来源:互联网公开数据 标签:音乐歌词,艺术家信息,音乐流派,摇滚,乡村,嘻哈,节奏布鲁斯,英语歌词,多语言支持 数据概述:...
    packageimg
  • 医疗翻译数据集

    2025年4月14日 30 66 8

    医疗翻译数据集 数据来源:互联网公开数据 标签:医疗翻译,多语言支持,医疗术语,公共健康,社会服务,语言技术,翻译工具 数据概述:...
    packageimg
  • 跨语言文本蕴含关系分类数据集

    2025年4月14日 30 167 83

    跨语言文本蕴含关系分类数据集 数据来源:互联网公开数据 标签:自然语言处理,跨语言分析,文本蕴含,机器学习,句子分类,逻辑推理,多语言支持 数据概述:...
    packageimg