-
西班牙语-英语翻译语料库数据集
西班牙语-英语翻译语料库数据集 数据来源:互联网公开数据 标签:西班牙语,英语,翻译,机器翻译,语言模型,自然语言处理,跨语言文本 数据概述:... -
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:... -
印度情绪分析社交媒体数据集2023
印度情绪分析社交媒体数据集2023 数据来源:互联网公开数据 标签:情绪分析,社交媒体,推特,英语,情感分类,数据标注,自然语言处理 数据概述: 本数据集包含通过Twitter... -
摩洛哥方言-英语词汇对照数据集
摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:... -
多语言医学问答数据集MedQA-4K数据集
多语言医学问答数据集MedQA-4K数据集 数据来源:互联网公开数据 标签:医学,问答,多语言,自然语言处理,机器学习,英语,中文,韩语,医疗,数据集 数据概述: 本数据集源于MedQA数据集,并精心挑选了多选题形式的医学问题。该数据集专为多语言自然语言处理和微调语言模型而设计。 关键特征: 语言分布:... -
英语到阿萨姆语平行语料库数据集
英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt... -
美国2009-2013年语言普查数据集
美国2009-2013年语言普查数据集 数据来源:互联网公开数据 标签:美国,语言普查,人口统计,州级数据,英语,非英语母语,语言多样性,语言使用趋势 数据概述:... -
孟加拉语英语字母书写仇恨言论数据集
孟加拉语英语字母书写仇恨言论数据集 数据来源:互联网公开数据 标签:孟加拉语,英语,仇恨言论,社交媒体,文本分析,自然语言处理,文化研究 数据概述:... -
约鲁巴语到英语机器翻译数据集
约鲁巴语到英语机器翻译数据集 数据来源:互联网公开数据 标签:约鲁巴语,英语,机器翻译,低资源语言,自然语言处理,数据集,模型训练,多领域应用 数据概述:... -
社交媒体情绪分析英语推文数据集-SemEval2018
社交媒体情绪分析英语推文数据集-SemEval2018 数据来源:互联网公开数据 标签:推文,情感分析,情绪识别,自然语言处理,文本挖掘,社交媒体,英语,SemEval,NLP 数据概述: 本数据集源自SemEval-2018 Task... -
皮埃罗格数据集-英语短文本主题相关性评估数据集
皮埃罗格数据集-英语短文本主题相关性评估数据集 数据来源:互联网公开数据 标签:文本,主题,相关性,评测,机器学习,教育,英语,自然语言处理,ChatGPT,GPT-4 数据概述: 皮埃罗格数据集是一个小型、开放许可的、机器生成的数据集,包含十五篇短篇英语文本,涵盖五个主题,并附带相关性判断(qrels),专为教育目的设计。... -
英语-印地语句子数据集
英语-印地语句子数据集 数据来源:互联网公开数据 标签:英语,印地语,句子翻译,语言学习,文本分析,机器翻译,双语数据集 数据概述: 本数据集包含2718条英语句子及其对应的印地语翻译,旨在为语言学习、文本分析和机器翻译研究提供高质量的双语数据。数据集中的每对句子均经过仔细校对,确保翻译的准确性和一致性。 数据用途概述:... -
英语-西班牙语和葡萄牙语语言变体数据集
英语-西班牙语和葡萄牙语语言变体数据集 数据来源:互联网公开数据 标签:语言变体,葡萄牙语,西班牙语,英语,地理分布,语言差异,文本分类,社会语言学 数据概述:... -
印度英语口音识别数据集1963-2021
印度英语口音识别数据集1963-2021 数据来源:互联网公开数据 标签:口音识别,英语,语音特征,机器学习,神经网络,音素发音,语音频谱 数据概述:... -
-
Rev平台字幕项目交付周期数据集-2024年1月
Rev平台字幕项目交付周期数据集-2024年1月 数据来源:互联网公开数据 标签:字幕,交付周期,项目管理,时间分析,众包,英语,Rev平台,自由职业者 数据概述:... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-... -
Wordle游戏有效猜测词与答案词汇数据集
Wordle游戏有效猜测词与答案词汇数据集 数据来源:互联网公开数据 标签:Wordle, 单词游戏, 猜测, 词汇, 数据集, 游戏, 答案, 英语 数据概述:... -
僧伽罗语-英语-新加坡英语翻译数据集
僧伽罗语-英语-新加坡英语翻译数据集 数据来源:互联网公开数据 标签:僧伽罗语,英语,新加坡英语,翻译数据,语言学习,机器翻译,语言学研究 数据概述: 本数据集包含僧伽罗语、英语和新加坡英语之间的翻译文本,每行记录包括一段僧伽罗语原文及其对应的英语和新加坡英语翻译。数据集结构清晰,便于进行文本分析和处理,为语言研究和翻译技术开发提供了可靠的数据支持。... -