-
语言服务与口译工作数据集DCWPLanguageLineInterpretationServicesDataset-isaaccordova
语言服务与口译工作数据集DCWPLanguageLineInterpretationServicesDataset-isaaccordova 数据来源:互联网公开数据 标签:语言服务,口译,数据集,公共服务,社会服务,数据分析,跨文化交流,语言技术 数据概述: 该数据集记录了语言服务与口译工作的相关数据,主要涵盖提供口译服务的详细内容。主要特征如下:... -
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,语言学习,数据集,英语,尼泊尔语,文本翻译,语言技术... -
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad 数据来源:互联网公开数据 标签:新闻评论,数据集,文本分析,情感分析,自然语言处理,机器学习,阿塞拜疆语,语言技术 数据概述: 该数据集包含来自阿塞拜疆新闻网站BİLDİR AZ的用户评论数据,记录了用户对新闻内容的反馈和观点。主要特征如下:... -
英语翻译数据集EnglishTranslatedDataset-tasnim34
英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:... -
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai 数据来源:互联网公开数据 标签:多语言问答,印地语,数据集,自然语言处理,机器学习,文本分析,问答系统,语言技术 数据概述: 该数据集包含来自多语言问答系统(MLQA)的印地语数据,记录了包含问题和对应答案的问答对。主要特征如下:... -
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:... -
自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar
自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,文本分类,人工智能,语言技术... -
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069 数据来源:互联网公开数据 标签:印地语英语混合语,数据集,自然语言处理,多语言研究,机器学习,语言分析,文本挖掘,语言技术 数据概述:... -
阿萨姆语文本到语音数据集
阿萨姆语文本到语音数据集 数据来源:互联网公开数据 标签:阿萨姆语,文本到语音,语音合成,语言技术,机器学习,自然语言处理,音频数据 数据概述: 本数据集是一个为阿萨姆语语音合成研究专门整理的资源,包含1877个阿萨姆语文本样本及其对应的音频录音。音频文件时长较短,平均约为3-4秒。数据集为开发和训练阿萨姆语的文本到语音(TTS)系统提供了基础支持。... -
英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn
英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:自然语言处理,光学字符识别,数据集,文本分析,机器学习,计算机视觉,语言技术,符号识别 数据概述:... -
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:... -
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:... -
自然语言处理与安全对话系统实验室NLP-SDS-Lab-V数据集-vikash1a2b3c
自然语言处理与安全对话系统实验室NLP-SDS-Lab-V数据集-vikash1a2b3c 数据来源:互联网公开数据 标签:自然语言处理,安全对话系统,数据集,人工智能,机器学习,文本分析,对话系统,语言技术 数据概述: 该数据集由NLP-SDS-Lab项目提供,记录了用于安全对话系统开发的自然语言处理数据。主要特征如下:... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:... -
-
自然语言处理文本纠错数据集
自然语言处理文本纠错数据集 数据来源:互联网公开数据 标签:自然语言处理,文本纠错,语法错误检测,机器学习,数据分类,语言技术,文本分析 数据概述:... -