-
多语言视觉问答数据集
2025年5月31日 30 12 5
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-... -
多语言视觉问答图像数据集
2025年8月8日 30 13 7
多语言视觉问答图像数据集_Multilingual_Visual_Question_Answering_Image_Dataset 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 图像分类, 自然语言处理, 机器翻译, 数据标注, 计算机视觉 数据概述:... -
多语言自然语言推理与跨语言推理数据集
2025年4月23日 30 24 6
多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-... -
多语言翻译应用性能评估数据集
2025年4月26日 30 12 2
多语言翻译应用性能评估数据集 数据来源:互联网公开数据 标签:翻译应用,多语言支持,翻译质量,用户评价,性能评估,自然语言处理,机器学习 数据概述:... -
多语言维基百科评论毒性分析数据集
2025年7月5日 30 30 10
多语言维基百科评论毒性分析数据集_Multilingual_Wikipedia_Comments_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 多语言, 文本分类, 自然语言处理, 机器学习, 评论分析, 情感分析, 机器翻译 数据概述:... -
多语言维基百科文章翻译质量评估数据集
2025年8月11日 30 20 5
多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:... -
多语言维基百科命名实体识别数据集
2025年4月14日 30 13 1
多语言维基百科命名实体识别数据集 数据来源:互联网公开数据 标签:多语言,维基百科,命名实体识别,PER,LOC,ORG,MISC,自然语言处理,机器学习 数据概述:... -
多语言灾害响应消息数据集
2025年4月14日 30 11 7
多语言灾害响应消息数据集 数据来源:互联网公开数据 标签:灾害响应,多语言,消息分类,自然语言处理,文本分析,紧急救援,机器学习 数据概述:... -
多语言毒性评论检测数据集
2025年4月15日 30 14 3
多语言毒性评论检测数据集 数据来源:互联网公开数据 标签:毒性评论,多语言,自然语言处理,机器学习,文本分类,跨语言学习 数据概述:... -
多语言有声书内容与市场分析数据集
2025年4月15日 30 29 10
多语言有声书内容与市场分析数据集 数据来源:互联网公开数据 标签:有声书,多语言,内容分析,市场研究,语言分布,用户偏好,出版趋势 数据概述: 本数据集收录了82,517本多语言有声书的详细信息,涵盖28种语言,包括英语、... -
多语言文本检测与识别自然语言处理数据集
2025年4月14日 30 22 2
多语言文本检测与识别自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言检测,语言识别,机器学习,文本分析,文化多样性,全球连接 数据概述:... -
多语言指令微调问答数据集
2025年7月7日 30 21 4
多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型 数据概述:... -
-
多语言恶意评论检测数据集
2025年9月17日 30 10 8
多语言恶意评论检测数据集_Multilingual_Toxic_Comment_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 毒性分析, 俄语, 西班牙语, 自然语言处理, 情感分析, 机器学习 数据概述:... -
多语言恶意文本检测数据集
2025年9月14日 30 30 8
多语言恶意文本检测数据集_Multilingual_Toxic_Text_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意文本, 多语言, 自然语言处理, 机器翻译, 情感分析, 毒性检测, 语言模型 数据概述: 该数据集包含来自多个语种的文本数据,旨在用于恶意文本的检测与分析。主要特征如下:... -
阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用
2025年4月20日 30 10 8
阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用 数据来源:互联网公开数据 标签:阿拉伯语,作文评分,自然语言处理,机器学习,数据集,文本分类,多语言,Open Orca, GPT-3.5, GPT-4, RAG, 翻译 数据概述:... -
多语言平行语料库数据集
2025年4月19日 30 11 4
多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-... -
多语言对话数据集
2025年4月14日 0 19 1
多语言对话数据集 数据来源:互联网公开数据 标签:多语言对话, AI训练, 自然语言处理, 跨语言系统, 会话分析, 聊天机器人, 多语言支持 数据概述: 本数据集是一个用于多语言对话模型训练的资源,包含中文、英文、韩语和日语四种主要语言的对话记录。数据集涵盖了广泛的对话场景,提供了结构化和多样化的会话数据,为开发跨语言对话系统提供了坚实的基础。... -
多语言实体关系抽取数据集
2025年8月5日 30 14 8
多语言实体关系抽取数据集_Multilingual_Entity_Relation_Extraction_Dataset 数据来源:互联网公开数据 标签:关系抽取, 自然语言处理, 文本挖掘, 嵌入向量, 多语言, 知识图谱, 实体识别, 机器学习 数据概述:... -
多语言大规模多任务语言理解数据集
2025年4月22日 30 30 8
多语言大规模多任务语言理解数据集 数据来源:互联网公开数据 标签:多语言,任务理解,人工智能,评测,翻译,低资源语言 数据概述:...