-
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 问答系统, 孟加拉语, 对比学习, 文本生成, 语言模型, 数据集 数据概述: 该数据集包含用于训练和评估孟加拉语指令问答模型的结构化数据。主要特征如下:... -
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan 数据来源:互联网公开数据 标签:孟加拉语, 文本语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语料库构建, 文本数据 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种来源的孟加拉语文本片段。主要特征如下:... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 词性标注, 语言模型, 语料库, 机器学习 数据概述:... -
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn 数据来源:互联网公开数据 标签:新闻文本, 土耳其, 文本分析, 自然语言处理, 时序分析, 舆情分析, 政治新闻, 语言模型 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224 数据来源:互联网公开数据 标签:英语写作, 文本评估, 语言模型, 语法分析, 文本分析, 写作质量, 自动评分, 自然语言处理 数据概述: 该数据集包含用于评估英语写作质量的结构化数据,记录了不同文本的多个维度评估分数。主要特征如下:... -
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung 数据来源:互联网公开数据 标签:机器翻译, 尼泊尔语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 数据集 数据概述: 该数据集包含来自多种来源的尼泊尔语-... -
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara 数据来源:互联网公开数据 标签:语音识别,孟加拉语,数据集,深度学习,自然语言处理,声学模型,语言模型,语音信号处理 数据概述: 该数据集包含孟加拉语语音数据,主要用于语音识别模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围为未知。... -
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本翻译, 英法翻译, 数据集, 语言模型, 双语对照 数据概述: 该数据集包含英法双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
写作能力评估与生成文本分析数据集EssayWritingSkillAssessmentandGeneratedTextAnalysis-krishanup
写作能力评估与生成文本分析数据集EssayWritingSkillAssessmentandGeneratedTextAnalysis-krishanup 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 论文写作, 语言模型, 机器学习, 文本分析, 语料库 数据概述:... -
英文文本可读性评估训练数据集EnglishTextReadabilityAssessmentTrainingDataset-adiyev
英文文本可读性评估训练数据集EnglishTextReadabilityAssessmentTrainingDataset-adiyev 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本难度, 语言模型, 语料库, 教育 数据概述:... -
百万笑话数据集MillionJokesDataset-avneets2103
百万笑话数据集MillionJokesDataset-avneets2103 数据来源:互联网公开数据 标签:笑话,文本数据,自然语言处理,情感分析,语言模型,喜剧,幽默,娱乐 数据概述: 该数据集包含了来自互联网的大量笑话文本。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期收集的笑话。 地理范围:... -
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 文本分析, 自然语言处理, 机器翻译, 语料库, 语言模型 数据概述: 该数据集包含来自阿拉伯新闻报道的摘要信息,旨在为阿拉伯语文本摘要任务提供数据支持。主要特征如下:... -
文本生成与润色评估数据集TextGenerationandRefinementEvaluationDataset-alvaromendizabal
文本生成与润色评估数据集TextGenerationandRefinementEvaluationDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本生成, 文本润色, 写作评估, 语言模型, 自然语言处理, 机器翻译, 错误检测, 内容质量 数据概述:... -
写作能力评估与生成文本分析数据集EssayWritingEvaluationandGeneratedTextAnalysisDataset-xiranhu
写作能力评估与生成文本分析数据集EssayWritingEvaluationandGeneratedTextAnalysisDataset-xiranhu 数据来源:互联网公开数据 标签:写作评估, 文本生成, 写作技巧, 英语写作, 自然语言处理, 机器写作, 文本分析, 语言模型 数据概述:... -
维基百科文章摘要数据集WikipediaArticleSummarizationDataset-nguyentuannguyen
维基百科文章摘要数据集WikipediaArticleSummarizationDataset-nguyentuannguyen 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,深度学习,信息检索,文本分析,语言模型 数据概述: 该数据集包含来自维基百科的文章及其对应的摘要。主要特征如下:... -
聊天机器人信息数据库数据集ChatterbotsDatabaseInformation-ayush12nagar
聊天机器人信息数据库数据集ChatterbotsDatabaseInformation-ayush12nagar 数据来源:互联网公开数据 标签:聊天机器人, 自然语言处理, 人工智能, 文本分析, 机器人, 语言模型, 数据库, 机器学习 数据概述:... -
大型语言模型聊天数据集LMSYSChatbotArenaAdditionalData90kColumnsDataset-susanketsarkar
大型语言模型聊天数据集LMSYSChatbotArenaAdditionalData90kColumnsDataset-susanketsarkar 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,聊天机器人,文本分析 数据概述: 该数据集包含来自LMSYS Chatbot... -
阿拉伯语文本完形填空数据集ArabicTextClozeTestDataset-omarelkholy74
阿拉伯语文本完形填空数据集ArabicTextClozeTestDataset-omarelkholy74 数据来源:互联网公开数据 标签:阿拉伯语, 文本完形填空, 自然语言处理, 机器阅读理解, 语言模型, 文本生成, 数据集, 填空题 数据概述: 该数据集包含来自互联网公开数据的阿拉伯语文本,记录了用于文本完形填空任务的句子对。主要特征如下:... -
写作质量评估多维度打分数据集WritingQualityEvaluationMulti-dimensionalScoringDataset-goldenlock
写作质量评估多维度打分数据集WritingQualityEvaluationMulti-dimensionalScoringDataset-goldenlock 数据来源:互联网公开数据 标签:文本评估, 写作质量, 多维度分析, 自然语言处理, 机器学习, 语言模型, 评估指标, 文本打分 数据概述:...