-
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 孟加拉语, 文本标注, 序列标注, 语言模型, 机器翻译, 文本分析 数据概述:... -
孟加拉语文本数据集BanglaTextDataset-sameen53
孟加拉语文本数据集BanglaTextDataset-sameen53 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 情感分析, 机器翻译 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本片段。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料。... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1 数据来源:互联网公开数据 标签:泰卢固语, 新闻文本, 文本分类, 自然语言处理, 情感分析, 语料库, 机器翻译, 印度 数据概述:... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox
文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox 数据来源:互联网公开数据 标签:文本匹配, 相似度计算, 自然语言处理, 数据集, 文本分类, 机器翻译, 深度学习, 中文 数据概述: 该数据集包含用于训练文本相似度匹配模型的数据,记录了文本对之间的相似性关系。主要特征如下:... -
蒙古语问答对数据集MongolianQuestionAnsweringCorpus-erdeneochir
蒙古语问答对数据集MongolianQuestionAnsweringCorpus-erdeneochir 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 蒙古语, 文本匹配, 语言模型, 数据集构建, 文本分析, 机器翻译 数据概述: 该数据集包含来自互联网的蒙古语问答对,记录了问题及其对应的答案。主要特征如下:... -
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 语义理解, 语料库, 语言模型 数据概述: 该数据集包含阿拉伯语的问答对,记录了问题及其相应的答案。主要特征如下:... -
越南语餐饮评论情感分析数据集VietnameseRestaurantReviewSentimentAnalysis-tnhokhng
越南语餐饮评论情感分析数据集VietnameseRestaurantReviewSentimentAnalysis-tnhokhng 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 餐饮评论, 自然语言处理, 数据标注, 机器翻译, 情感极性 数据概述:... -
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 英法翻译, 语料库, 自然语言处理, 双语对照, 文本对齐, 语言模型 数据概述:... -
孟加拉语语音转录数据集BanglatoIPA-jakir57
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:... -
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke 数据来源:互联网公开数据 标签:文本摘要, 法语, 自然语言处理, 机器翻译, 文本生成, 深度学习, 语料库, 摘要模型 数据概述: 该数据集包含来自不同来源的法语文本数据,旨在用于训练文本摘要生成模型。主要特征如下:... -
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:文本改写,自然语言处理,机器翻译,科技文本,数据增强,模型训练,Prompt工程,文本生成 数据概述: 该数据集包含来自科技领域的文本,记录了原文、改写提示(rewrite... -
多语言文本语义相似度评测数据集MultilingualTextSemanticSimilarityEvaluationDataset-shubhamkathiriya
多语言文本语义相似度评测数据集MultilingualTextSemanticSimilarityEvaluationDataset-shubhamkathiriya 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 多语言, 文本匹配, 语义分析, 自然语言处理, 语言对比, 数据集 数据概述:... -
孟加拉语新闻摘要文本分类数据集BengaliNewsSummaryTextClassificationDataset-nirob5315
孟加拉语新闻摘要文本分类数据集BengaliNewsSummaryTextClassificationDataset-nirob5315 数据来源:互联网公开数据 标签:文本摘要, 文本分类, 孟加拉语, 自然语言处理, 情感分析, 多分类, 机器翻译, 语料库 数据概述:... -
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 语料库, 自然语言处理, 双语对照 数据概述:... -
越南语文本相似度评估数据集VietnameseTextSimilarityEvaluationDataset-dangthai
越南语文本相似度评估数据集VietnameseTextSimilarityEvaluationDataset-dangthai 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 越南语, 语义分析, 文本匹配, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含越南语文本对,用于评估句子间的语义相似度。主要特征如下:... -
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua 数据来源:互联网公开数据 标签:机器翻译, 俄语, 文本翻译, 自然语言处理, 文本对齐, 语言模型, 翻译评估, 文本处理 数据概述:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentRelations-ravi02516
多语言文本蕴含关系数据集MultilingualTextualEntailmentRelations-ravi02516 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 多语言, 机器翻译, 语义理解, 文本推理, 语料分析, 文本匹配 数据概述: 该数据集包含来自互联网的翻译文本数据,记录了不同语言的文本对之间的蕴含关系。主要特征如下:...