-
法语句对翻译平行语料数据集French-EnglishParallelCorpusforTranslation-giangtranduc
法语句对翻译平行语料数据集French-EnglishParallelCorpusforTranslation-giangtranduc 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 法语, 英语, 语料库, 自然语言处理, 文本对齐, 语言模型 数据概述:... -
文本可读性分析数据集TextReadabilityAnalysisDataset-uocoeeds
文本可读性分析数据集TextReadabilityAnalysisDataset-uocoeeds 数据来源:互联网公开数据 标签:文本分析, 可读性, 自然语言处理, 语料库, 文本难度, 语言模型, 机器学习, 教育 数据概述: 该数据集包含从互联网上收集的文本片段及其可读性评估结果,旨在用于研究和分析文本的可读性。主要特征如下:... -
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 尼泊尔语, 平行语料, 语言模型, 自然语言处理, 跨语言 数据概述: 该数据集包含印地语-... -
俄语机器翻译BeamSearch参数分析数据集RussianMachineTranslationBeamSearchParameterAnalysis-m...
俄语机器翻译BeamSearch参数分析数据集RussianMachineTranslationBeamSearchParameterAnalysis-mishayakovlev 数据来源:互联网公开数据 标签:机器翻译, 自然语言处理, 俄语, Beam Search, 模型评估, 文本分析, 语言模型, 数据集 数据概述:... -
自然语言推理句子对数据集NaturalLanguageInferenceSentencePairsDataset-sadhanamohankumar
自然语言推理句子对数据集NaturalLanguageInferenceSentencePairsDataset-sadhanamohankumar 数据来源:互联网公开数据 标签:自然语言推理, 文本匹配, 语义理解, 句子关系, 文本蕴含, 数据标注, 机器学习, 语言模型 数据概述:... -
文本生成质量评估增强数据集TextGenerationQualityEvaluationEnhancementDataset-cliffe123
文本生成质量评估增强数据集TextGenerationQualityEvaluationEnhancementDataset-cliffe123 数据来源:互联网公开数据 标签:文本生成, 质量评估, 自然语言处理, 文本分析, 语料增强, 数据增强, 语言模型, 语法分析 数据概述:... -
土耳其语文本去重音标注数据集TurkishTextDiacritizationDataset-omerfarukaydin61
土耳其语文本去重音标注数据集TurkishTextDiacritizationDataset-omerfarukaydin61 数据来源:互联网公开数据 标签:自然语言处理, 土耳其语, 文本处理, 文本纠错, 语言模型, 数据集, 机器翻译, 文本预处理 数据概述:... -
信息检索荷兰语问答数据集InformationRetrievalDutchQuestionAnsweringDataset-abhishektopwal
信息检索荷兰语问答数据集InformationRetrievalDutchQuestionAnsweringDataset-abhishektopwal 数据来源:互联网公开数据 标签:信息检索, 问答系统, 荷兰语, 自然语言处理, 文本分析, 语料库, 语言模型, 数据集 数据概述:... -
文本生成与评估-Prompt驱动的论文写作数据集TextGenerationandEvaluation-Prompt-DrivenEssayWriting...
文本生成与评估-Prompt驱动的论文写作数据集TextGenerationandEvaluation-Prompt-DrivenEssayWritingDataset-laurensprast 数据来源:互联网公开数据 标签:文本生成, 论文写作, 提示词, 自然语言处理, 文本评估, 语言模型, 写作质量, 数据分析 数据概述:... -
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 语言模型, 文本校对, 西班牙语, 印地语, 英语 数据概述:... -
社交媒体平台仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-krishamehta0810
社交媒体平台仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-krishamehta0810 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 自然语言处理, 文本分类, 情感分析, 语言模型, 数据标注, 机器学习 数据概述:... -
孟加拉语情感分析数据集BengaliSentimentAnalysisDataset-arijitsaha1712
孟加拉语情感分析数据集BengaliSentimentAnalysisDataset-arijitsaha1712 数据来源:互联网公开数据 标签:情感分析, 孟加拉语, 文本分类, 情感标注, 自然语言处理, 机器学习, 文本情感, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了文本内容及其对应的情感极性。主要特征如下:... -
命名实体识别俄语文本数据集NamedEntityRecognitionRussianTextDataset-benzom
命名实体识别俄语文本数据集NamedEntityRecognitionRussianTextDataset-benzom 数据来源:互联网公开数据 标签:命名实体识别, 俄语, 自然语言处理, 文本标注, 语言模型, 文本分析, 机器学习, 语料库 数据概述:... -
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 平行语料, 自然语言处理, 文本对齐, 语言模型, 跨语言 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 乌尔都语, 自然语言处理, 文本分析, 语料库, 深度学习, 语言模型 数据概述: 该数据集包含来自互联网的乌尔都语新闻报道摘要。主要特征如下:... -
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu 数据来源:互联网公开数据 标签:文本增强, 越南语, 自然语言处理, 数据集构建, 机器翻译, 语言模型, 数据扩充, 文本生成 数据概述: 该数据集包含用于越南语文本数据增强的语料,记录了越南语文本对及其对应的增强版本。主要特征如下:... -
情景喜剧剧本对话数据集SitcomScriptDialogueDataset-kipabed
情景喜剧剧本对话数据集SitcomScriptDialogueDataset-kipabed 数据来源:互联网公开数据 标签:剧本分析, 对话内容, 自然语言处理, 文本挖掘, 情感分析, 喜剧, 语言模型, 影视剧本 数据概述: 该数据集包含来自情景喜剧剧本的对话文本,记录了剧集中角色间的互动与对白。主要特征如下:... -
新闻语料标题与正文关联分析数据集NewsCorpusTitleandBodyAssociation-abhi0708
新闻语料标题与正文关联分析数据集NewsCorpusTitleandBodyAssociation-abhi0708 数据来源:互联网公开数据 标签:新闻语料, 文本分析, 自然语言处理, 标题生成, 摘要提取, 语言模型, 文本相似度, 数据挖掘 数据概述:... -
孟加拉语文本数据集BengaliTextDataset-nasiatfahim
孟加拉语文本数据集BengaliTextDataset-nasiatfahim 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 语料库, 自然语言处理, 文本分析, 机器翻译, 情感分析, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本内容。主要特征如下:... -
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu 数据来源:互联网公开数据 标签:自然语言处理, 词汇表, 文本生成, 语言模型, 深度学习, 文本分析, 数据预处理, 词嵌入 数据概述:...