找到16个数据集

格式: ZIP 标签: 多语言数据

过滤结果
  • 波斯尼亚语新闻文章数据集

    2025年5月6日 30 4 0

    波斯尼亚语新闻文章数据集 数据来源:互联网公开数据 标签:波斯尼亚语,新闻,文本分类,情感分析,主题建模,klix.ba,自然语言处理,新闻分析,多语言数据 数据概述:...
    packageimg
  • 概念网单词关系数据集

    2025年5月6日 30 66 36

    概念网单词关系数据集 数据来源:互联网公开数据 标签:概念网,单词关系,语义网络,多语言数据,知识图谱,自然语言处理 数据概述:...
    packageimg
  • 新闻分类僧伽罗语-英语数据集

    2025年5月6日 30 191 129

    新闻分类僧伽罗语-英语数据集 数据来源:互联网公开数据 标签:新闻分类,僧伽罗语,英语,自然语言处理,文本分类,机器学习,多语言数据 数据概述:...
    packageimg
  • 亚马逊商品英文评论及其法语翻译数据集

    2025年4月27日 30 97 68

    亚马逊商品英文评论及其法语翻译数据集 数据来源:互联网公开数据 标签:亚马逊评论,英文,法语,翻译,自然语言处理,多语言数据,商品评价 数据概述: 本数据集包含从1996年至2014年间亚马逊商品的英文评论,并提供了这些评论的法语翻译。数据集涵盖了多种商品类别,每条评论均包含原始英文文本及其对应的法语翻译,为研究多语言自然语言处理提供了丰富的数据资源。...
    packageimg
  • 电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86

    2025年4月26日 30 1 0

    电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...
    packageimg
  • 楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov

    2025年4月25日 30 18 16

    楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
    packageimg
  • 语言翻译数据集2010-2020数据集-amankumar2002

    2025年4月23日 30 148 78

    语言翻译数据集2010-2020数据集-amankumar2002 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,语言学,多语言数据,文本翻译 数据概述:该数据集包含来自多个公开来源的语言翻译数据,记录了多种语言之间的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • Basalam产品实体分类数据集

    2025年4月19日 30 79 51

    Basalam产品实体分类数据集 数据来源:互联网公开数据 标签:实体分类,产品分类,波斯语文本,电子商务,多语言数据,市场分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 多语言命名实体识别数据集

    2025年4月19日 30 47 25

    多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:...
    packageimg
  • 语言切换数据集

    2025年4月18日 30 92 19

    语言切换数据集 数据来源:互联网公开数据 标签:语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系 数据概述: 本数据集包含了多种语言之间的翻译记录,主要针对源语言(language)与目标语言(language_t)之间的对应关系。通过Google...
    packageimg
  • 土耳其-英语翻译数据集

    2025年4月16日 30 29 2

    土耳其-英语翻译数据集 数据来源:互联网公开数据 标签:语言翻译,土耳其语,英语,多语言数据,文本翻译 数据概述: 本数据集来源于Tatoeba网站,包含了土耳其语与英语之间的翻译对。数据集主要由三列组成: Turkish:土耳其语单词或短语。 English:对应土耳其语单词或短语的英语翻译。...
    packageimg
  • 斯瓦希里语新闻分类数据集

    2025年4月16日 30 80 53

    斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
    packageimg
  • 西班牙语有毒评论分析数据集

    2025年4月15日 30 83 72

    西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21...
    packageimg
  • 即时通讯应用评价数据集

    2025年4月15日 30 210 145

    即时通讯应用评价数据集 数据来源:互联网公开数据 标签:即时通讯应用,客户评价,多语言数据,谷歌Play商店,文本分析,情感分析,自然语言处理 数据概述...
    packageimg
  • 印尼术语词汇表数据集

    2025年4月14日 30 71 27

    印尼术语词汇表数据集 数据来源:互联网公开数据 标签:印尼语,词汇表,术语翻译,语言学习,知识领域,多语言数据,教育工具 数据概述: 本数据集包含从互联网公开来源抓取的182,410条外语词汇及其印尼语等价词和相关知识领域的信息。数据集以CSV格式存储,包含以下三个字段: 1. 外语词汇(foreign):外语术语。 2....
    packageimg
  • 一带一路倡议情感分析数据集

    2025年4月14日 30 155 44

    一带一路倡议情感分析数据集 数据来源:互联网公开数据 标签:一带一路, 情感分析, 新闻文本, 社交媒体, 多语言数据, 舆论监测, 数据挖掘 数据概述:...
    packageimg