-
波斯尼亚语新闻文章数据集
2025年5月6日 30 189 29
波斯尼亚语新闻文章数据集 数据来源:互联网公开数据 标签:波斯尼亚语,新闻,文本分类,情感分析,主题建模,klix.ba,自然语言处理,新闻分析,多语言数据 数据概述:... -
-
新闻分类僧伽罗语-英语数据集
2025年5月6日 30 144 53
新闻分类僧伽罗语-英语数据集 数据来源:互联网公开数据 标签:新闻分类,僧伽罗语,英语,自然语言处理,文本分类,机器学习,多语言数据 数据概述:... -
亚马逊商品英文评论及其法语翻译数据集
2025年4月27日 30 55 20
亚马逊商品英文评论及其法语翻译数据集 数据来源:互联网公开数据 标签:亚马逊评论,英文,法语,翻译,自然语言处理,多语言数据,商品评价 数据概述: 本数据集包含从1996年至2014年间亚马逊商品的英文评论,并提供了这些评论的法语翻译。数据集涵盖了多种商品类别,每条评论均包含原始英文文本及其对应的法语翻译,为研究多语言自然语言处理提供了丰富的数据资源。... -
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86
2025年4月26日 30 149 94
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:... -
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov
2025年4月25日 30 51 33
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:... -
语言翻译数据集2010-2020数据集-amankumar2002
2025年4月23日 30 99 67
语言翻译数据集2010-2020数据集-amankumar2002 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,语言学,多语言数据,文本翻译 数据概述:该数据集包含来自多个公开来源的语言翻译数据,记录了多种语言之间的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
Basalam产品实体分类数据集
2025年4月19日 30 12 5
Basalam产品实体分类数据集 数据来源:互联网公开数据 标签:实体分类,产品分类,波斯语文本,电子商务,多语言数据,市场分析,机器学习,自然语言处理 数据概述:... -
多语言命名实体识别数据集
2025年4月19日 30 144 80
多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:... -
语言切换数据集
2025年4月18日 30 41 37
语言切换数据集 数据来源:互联网公开数据 标签:语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系 数据概述: 本数据集包含了多种语言之间的翻译记录,主要针对源语言(language)与目标语言(language_t)之间的对应关系。通过Google... -
土耳其-英语翻译数据集
2025年4月16日 30 8 6
土耳其-英语翻译数据集 数据来源:互联网公开数据 标签:语言翻译,土耳其语,英语,多语言数据,文本翻译 数据概述: 本数据集来源于Tatoeba网站,包含了土耳其语与英语之间的翻译对。数据集主要由三列组成: Turkish:土耳其语单词或短语。 English:对应土耳其语单词或短语的英语翻译。... -
斯瓦希里语新闻分类数据集
2025年4月16日 30 193 79
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:... -
西班牙语有毒评论分析数据集
2025年4月15日 30 196 125
西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21... -
即时通讯应用评价数据集
2025年4月15日 30 45 22
即时通讯应用评价数据集 数据来源:互联网公开数据 标签:即时通讯应用,客户评价,多语言数据,谷歌Play商店,文本分析,情感分析,自然语言处理 数据概述... -
印尼术语词汇表数据集
2025年4月14日 30 69 26
印尼术语词汇表数据集 数据来源:互联网公开数据 标签:印尼语,词汇表,术语翻译,语言学习,知识领域,多语言数据,教育工具 数据概述: 本数据集包含从互联网公开来源抓取的182,410条外语词汇及其印尼语等价词和相关知识领域的信息。数据集以CSV格式存储,包含以下三个字段: 1. 外语词汇(foreign):外语术语。 2.... -
一带一路倡议情感分析数据集
2025年4月14日 30 22 2
一带一路倡议情感分析数据集 数据来源:互联网公开数据 标签:一带一路, 情感分析, 新闻文本, 社交媒体, 多语言数据, 舆论监测, 数据挖掘 数据概述:...