-
波兰语英语词汇对数据集-安基韦网站2023
波兰语英语词汇对数据集-安基韦网站2023 数据来源:互联网公开数据 标签:波兰语,英语,词汇,闪卡,语言学习,双语,例句,同义词,反义词,语法 数据概述:... -
沙特阿拉伯行政区划数据集
沙特阿拉伯行政区划数据集 数据来源:互联网公开数据 标签:沙特阿拉伯,行政区划,地区,城市,区县,阿拉伯语,英语,地理信息 数据概述: 本数据集包含了沙特阿拉伯13个地区、4580个城市和3732个区县的相关参考数据,信息同时用阿拉伯语和英语描述。数据来源于沙特阿拉伯地图服务(https://maps.address.gov.sa/)和Google... -
-
印度孟加拉语与英语新闻研究数据集2018-2021
印度孟加拉语与英语新闻研究数据集2018-2021 数据来源:互联网公开数据 标签:新闻分析,假新闻检测,情感分析,语言学研究,印度,孟加拉语,英语,数据清洗 数据概述:... -
Hinglish印地语-英语混合语机器翻译数据集
Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish... -
英德阿拉伯文本翻译数据集
英德阿拉伯文本翻译数据集 数据来源:互联网公开数据 标签:文本翻译,语言学,英语,德语,阿拉伯语,多语言数据集,语言对比 数据概述: 本数据集包含从英语翻译到德语和阿拉伯语的多语言文本内容。数据集涵盖了广泛的文本类型,适用于语言学研究、机器翻译模型训练以及跨语言信息处理等领域。其中,阿拉伯语翻译部分来源于特定的数据集。 数据用途概述:... -
英语至印地文罗马化翻译数据集
英语至印地文罗马化翻译数据集 数据来源:互联网公开数据 标签:英语,印地文,罗马化,翻译,31字母,化学,生物,地理 数据概述: 本数据集用于将英语翻译成印地文的罗马化形式。数据集中使用了31个字母来转写梵文字母的印地文,包括26个拉丁字母a-... -
-
卢旺达语数据集
卢旺达语数据集 数据来源:互联网公开数据 标签:卢旺达语,法语,英语,斯瓦希里语,语言检测,机器学习,自然语言处理 数据概述: 本数据集旨在用于训练和测试能够识别四种语言文本的语言检测人工智能模型,包括卢旺达语、法语、英语和斯瓦希里语。数据集包含每种语言的多样化文本样本,适用于训练机器学习模型。每个文本样本都标注了相应的语言,以支持监督学习。... -
乌尔都语和英语文本摘要数据集
乌尔都语和英语文本摘要数据集 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,乌尔都语,英语,多语言任务,机器学习 数据概述: 本数据集名为“AllDataV1”,专为自然语言处理(NLP)任务设计,特别适用于乌尔都语和英语的抽象摘要任务。数据集包含4,386条记录,共有5个字段,结构清晰,具体内容如下: 1. Unnamed:... -
阿拉伯语-英语句子库25000句
阿拉伯语-英语句子库25000句 数据来源:互联网公开数据 标签:阿拉伯语,英语,双语句子,自然语言处理,机器学习,语句类型,多语言理解,教育培训 数据概述: 阿拉伯语-... -
不适当词汇分类数据集
不适当词汇分类数据集 数据来源:互联网公开数据 标签:词汇分类,情感分析,不适当词汇,自然语言处理,英语,Singlish 数据概述: 本数据集包含被分类为正面或负面的词汇列表,所有收录的词汇已经过预处理。数据集中每个词汇附带有情感值,用以描述该词汇是否为不适当的。数据集中的词汇包括英语和Singlish两种语言,为研究和分析词汇情感提供了双语基础。... -
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-... -
Wordle游戏词汇库-5字母单词数据集
Wordle游戏词汇库-5字母单词数据集 数据来源:互联网公开数据 标签:Wordle, 单词, 词汇, 语言, 游戏, 英语, 词库 数据概述: 本数据集包含13,112个五字母单词,专为Wordle游戏爱好者及语言学习者打造。数据集收录了广泛的英语词汇,涵盖常用词汇及部分生僻词汇,旨在为用户提供丰富的词汇资源,满足不同的游戏挑战和语言学习需求。... -
数据2023年最受欢迎英语电影数据集
数据2023年最受欢迎英语电影数据集 数据来源:互联网公开数据 标签:电影,英语,流行度,评分,推荐系统,数据分析,机器学习 数据概述: 本数据集收录了2023年10,000部最受欢迎的英语电影信息,涵盖电影名称、概要、上映日期、分类(流派)、流行度评分、平均评分和投票总数等关键要素。数据来源于TMDB(The Movie... -
印地语-英语混合数据集
印地语-英语混合数据集 数据来源:互联网公开数据 标签:印地语,英语,混合语言,评论数据,网络欺凌,文本分类,社会媒体分析 数据概述: 本数据集包含超过9000条标注的印地语-英语混合语言(Hinglish)评论。每条评论都被标注为0或1,分别表示非欺凌评论和欺凌评论。数据集提供了丰富的多语言文本样本,适用于分析和研究网络环境中的欺凌行为。... -
皮尤研究中心美国趋势面板第106波数据集
皮尤研究中心美国趋势面板第106波数据集 数据来源:互联网公开数据 标签:皮尤研究中心,美国趋势面板,公众调查,2022,网络调查,英语,西班牙语,社会趋势,公众意见 数据概述:... -
IMDb高分动作电影票房及影评数据集-多语言电影
IMDb高分动作电影票房及影评数据集-多语言电影 数据来源:互联网公开数据 标签:动作电影,IMDb,电影票房,影评,多语言,英语,泰米尔语,中文,法语,电影数据 数据概述:... -
英语月经健康与卫生聊天机器人数据集
英语月经健康与卫生聊天机器人数据集 数据来源:互联网公开数据 标签:月经健康,卫生,聊天机器人,自然语言处理,对话系统,健康咨询,英语 数据概述: 本数据集由哈比大学团队Mai作为毕业设计项目的一部分整理而成,旨在通过构建一个基于变换器的英文聊天机器人来解决月经健康和卫生相关问题。数据集来源于多个渠道,包括Hello... -
英语单词频率数据集
英语单词频率数据集 数据来源:互联网公开数据 标签:单词频率,英语,语料库分析,自然语言处理,文本挖掘,数据可视化,机器学习 数据概述: 本数据集基于Google...