-
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 声学模型, 语言模型, 机器翻译, 数据集, 语音处理 数据概述: 该数据集包含来自公开测试数据的语音转录文本,记录了语音文件与其对应的文本转录内容。主要特征如下:... -
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-...
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-hemangkhatri07 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 多语言, 机器翻译, 文本分析, 印度语, 英语, 文本对齐 数据概述:... -
豪萨语-英语混合文本问答数据集Hausa-EnglishCode-mixedQuestionAnsweringDataset-usmanmusa
豪萨语-英语混合文本问答数据集Hausa-EnglishCode-mixedQuestionAnsweringDataset-usmanmusa 数据来源:互联网公开数据 标签:机器翻译, 文本分类, 语言混合, 豪萨语, 英语, 问答系统, 自然语言处理, 跨语言分析 数据概述: 该数据集包含来自Usman Musa... -
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 多语言, 情感分析, 机器翻译, 数据标注, 语言学, 自然语言处理 数据概述:... -
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 多语言, 英语, 阿姆哈拉语, 马拉地语, 泰卢固语, 语料库, 自然语言处理, 语言学 数据概述:... -
多语言情感分析模型预测结果数据集MultilingualSentimentAnalysisModelPredictionResults-muennighoff
多语言情感分析模型预测结果数据集MultilingualSentimentAnalysisModelPredictionResults-muennighoff 数据来源:互联网公开数据 标签:情感分析, 多语言, 文本分类, 模型预测, 机器翻译, 自然语言处理, 评估, 性能分析 数据概述:... -
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe 数据来源:互联网公开数据 标签:文本转写, 语言模型, 马拉地语, 印度语言, 文本处理, 自然语言处理, 机器翻译, 数据集 数据概述:... -
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026 数据来源:互联网公开数据 标签:机器翻译, 语言学, 泰米尔语, 英语, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语与泰米尔语的翻译对照,旨在为机器翻译模型提供训练数据。主要特征如下:... -
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-sau...
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 印地语, 英语, Hinglish, 多语言, 自然语言处理 数据概述:... -
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:法律文本, 文本改写, 自然语言处理, 法律分析, 文本生成, 机器翻译, 数据集构建, 语料库 数据概述: 该数据集包含法律案例的原文文本,以及根据特定提示改写后的文本。主要特征如下:... -
文本语义相似度判断数据集TextSemanticSimilarityJudgement-florianburger3
文本语义相似度判断数据集TextSemanticSimilarityJudgement-florianburger3 数据来源:互联网公开数据 标签:文本匹配, 语义分析, 自然语言处理, 句子对, 相似度, 情感分析, 数据标注, 机器翻译 数据概述: 该数据集包含用于评估文本语义相似度的句子对,记录了句子之间的语义关联程度。主要特征如下:... -
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05 数据来源:互联网公开数据 标签:语义相似度, 文本理解, 自然语言处理, 句子对, 情感分析, 机器翻译, 文本匹配, 数据集 数据概述: 该数据集包含来自多个来源的文本对,记录了句子之间的语义相似度信息。主要特征如下:... -
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文NLP, 情感识别, 机器翻译, 数据集, 深度学习, 自然语言处理 数据概述:... -
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 基尼亚语, 自然语言处理, 语料库, 机器翻译, 文本匹配, 情感分析, 数据标注 数据概述: 该数据集包含来自基尼亚语文本的配对数据,记录了文本对之间的相似度评分。主要特征如下:... -
波斯古典文学诗歌Prompt-Completion数据集PersianClassicalPoetryPrompt-CompletionDataset-minar61
波斯古典文学诗歌Prompt-Completion数据集PersianClassicalPoetryPrompt-CompletionDataset-minar61 数据来源:互联网公开数据 标签:波斯语, 诗歌, 文本生成, 自然语言处理, Prompt, Completion, 机器翻译, 语言模型 数据概述:... -
维基百科中文文本摘要数据集WikipediaChineseTextSummaryDataset-omerparlak
维基百科中文文本摘要数据集WikipediaChineseTextSummaryDataset-omerparlak 数据来源:互联网公开数据 标签:文本摘要, 中文文本, 维基百科, 自然语言处理, 文本挖掘, 语料库, 机器翻译, 深度学习 数据概述: 该数据集包含来自维基百科的中文文本摘要,旨在为文本摘要任务提供训练和评估数据。主要特征如下:... -
心理健康多语言问答数据集MentalHealthMultilingualQuestionandAnswerDataset-mohamedbassat
心理健康多语言问答数据集MentalHealthMultilingualQuestionandAnswerDataset-mohamedbassat 数据来源:互联网公开数据 标签:心理健康, 问答系统, 情感分析, 机器翻译, 文本生成, 多语言, 阿拉伯语, 英语 数据概述:... -
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 数据标注, 机器翻译, 语料库 数据概述:... -
机器翻译英语-法语平行语料数据集MachineTranslationEnglish-FrenchParallelCorpus-giangtranduc
机器翻译英语-法语平行语料数据集MachineTranslationEnglish-FrenchParallelCorpus-giangtranduc 数据来源:互联网公开数据 标签:机器翻译, 语料库, 英语, 法语, 自然语言处理, 文本数据, 语言模型, 翻译模型 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-phoenixdev
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-phoenixdev 数据来源:互联网公开数据 标签:乌尔都语,文本摘要,自然语言处理,新闻摘要,语言模型,文本分析,机器翻译,语料库 数据概述: 该数据集包含来自互联网的乌尔都语新闻摘要,记录了新闻文章的摘要内容。主要特征如下:...