找到388个数据集

标签: 多语言

过滤结果
  • 土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin

    2025年4月25日   

    土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻分析,数据集,自然语言处理,文本分类,机器学习,新闻媒体,土耳其,多语言 数据概述: 该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据,记录了该媒体发布的新闻内容。主要特征如下:...
    packageimg
  • 基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg

    2025年4月25日   

    基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:...
    packageimg
  • 乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab

    2025年4月25日   

    乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:...
    packageimg
  • 斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras

    2025年4月25日   

    斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras 数据来源:互联网公开数据 标签:文本分析,有害内容,数据集,自然语言处理,机器学习,情感分析,多语言,斯拉夫语言 数据概述:...
    packageimg
  • 合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy

    2025年4月24日   

    合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:...
    packageimg
  • 国籍分类数据集NationalityClassificationDataset-gauravduttakiit

    2025年4月24日   

    国籍分类数据集NationalityClassificationDataset-gauravduttakiit 数据来源:互联网公开数据 标签:国籍分类,数据集,机器学习,文本分析,自然语言处理,数据挖掘,人工智能,多语言 数据概述: 该数据集包含来自互联网公开来源的国籍分类数据,记录了不同国籍的身份标识信息。主要特征如下:...
    packageimg
  • 亚马逊Prime视频多语言电影数据集AmazonPrimeVideoMulti-LanguageMovieDataset-abilashpothakanuri

    2025年4月24日   

    亚马逊Prime视频多语言电影数据集AmazonPrimeVideoMulti-LanguageMovieDataset-abilashpothakanuri 数据来源:互联网公开数据 标签:影视数据,多语言,数据集,电影分析,流媒体,内容推荐,数据挖掘,机器学习 数据概述:...
    packageimg
  • 亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998

    2025年4月24日   

    亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:...
    packageimg
  • 多语言文本数据集Multi-LanguageTextDataset-farouqalzeer

    2025年4月24日   

    多语言文本数据集Multi-LanguageTextDataset-farouqalzeer 数据来源:互联网公开数据 标签:多语言,文本数据,自然语言处理,数据集,机器学习,文本分类,语言翻译,语言技术 数据概述: 该数据集包含来自多个不同语言的文本数据,记录了多种语言的自然语言文本内容。主要特征如下: 时间跨度:...
    packageimg
  • 多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan

    2025年4月24日   

    多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan 数据来源:互联网公开数据 标签:多语言,文本分析,情绪识别,情感计算,自然语言处理,机器学习,心理学,数据集 数据概述:该数据集包含来自多个来源的多语言文本数据,记录了不同语言文本中的情绪标注。主要特征如下:...
    packageimg
  • 泰米尔语开放域问答数据集TamilOdqaDataset-aswin037

    2025年4月24日   

    泰米尔语开放域问答数据集TamilOdqaDataset-aswin037 数据来源:互联网公开数据 标签:泰米尔语,开放域问答,数据集,自然语言处理,机器学习,文本理解,问答系统,多语言 数据概述: 该数据集包含来自泰米尔语的开放域问答数据,记录了泰米尔语文本及其对应的问答对。主要特征如下:...
    packageimg
  • 机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876

    2025年4月24日   

    机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876 数据来源:互联网公开数据 标签:机器翻译,文本对齐,数据集,自然语言处理,多语言,深度学习,数据增强,语言模型 数据概述:该数据集包含来自 My Dear Watson...
    packageimg
  • 多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction

    2025年4月24日   

    多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction 数据来源:互联网公开数据 标签:语言学,多语言,词汇数据集,自然语言处理,翻译研究,语言对比,数据科学,教育技术 数据概述: 该数据集包含来自100种不同语言的常用词汇数据,记录了各语言中的基础词汇及其对应翻译。主要特征如下:...
    packageimg
  • 多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang

    2025年4月24日   

    多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
    packageimg
  • 法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari

    2025年4月24日   

    法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,语言模型,多语言,教育技术,智能助手 数据概述: 该数据集包含用于训练法语智能助手的多语言对话数据,记录了用户与AI助手之间的交互内容。主要特征如下:...
    packageimg
  • 多语言自然语言推理数据集MultilingualNaturalLanguageInferenceDataset-sanjusrivatsa9

    2025年4月24日   

    多语言自然语言推理数据集MultilingualNaturalLanguageInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,语义理解,机器学习,文本分析,人工智能 数据概述:...
    packageimg
  • 英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29

    2025年4月24日   

    英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,语言技术,翻译模型,人工智能,语言学习 数据概述:该数据集包含英语到印地语的平行语料,主要用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 翻译数据集TranslatedDataset-waelfezari

    2025年4月24日   

    翻译数据集TranslatedDataset-waelfezari 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,文本分析,语言学,多语言,深度学习,文本对齐 数据概述: 该数据集包含多种语言的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的创建时间。...
    packageimg
  • 真实翻译数据集RealTranslatedDataset-tihsrahly

    2025年4月24日   

    真实翻译数据集RealTranslatedDataset-tihsrahly 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,文本分析,机器学习,自然语言处理,多语言,人工智能 数据概述: 该数据集包含来自真实翻译项目的文本数据,记录了多种语言之间的翻译对。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能跨越多个时间段。...
    packageimg
  • 多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif

    2025年4月24日   

    多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,人工智能,翻译技术,语言学,文本分析 数据概述: 该数据集包含多语言机器翻译模型MT5的翻译结果,记录了多种语言之间的翻译准确性,速度和质量。主要特征如下:...
    packageimg