-
孟加拉语文本标点纠正预测数据集
孟加拉语文本标点纠正预测数据集_Bangla_Text_Punctuation_Correction_Prediction_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本纠错, 标点符号, 机器学习, 文本生成, 序列标注, 语言模型, 孟加拉语 数据概述:... -
文本改写提示语数据集
文本改写提示语数据集_Text_Rewriting_Prompts 数据来源:互联网公开数据 标签:文本生成, 提示工程, 自然语言处理, 文本编辑, 语言模型, 数据标注, 文本转换, 零样本学习 数据概述: 该数据集包含用于文本改写任务的提示语,记录了多种文本改写指令,旨在引导语言模型生成不同风格和语境的文本。主要特征如下:... -
写作质量评估多维度打分数据集
写作质量评估多维度打分数据集_Writing_Quality_Multi_dimensional_Scoring_Dataset 数据来源:互联网公开数据 标签:写作评估, 文本分析, 语言模型, 机器学习, 文本质量, 语法, 连贯性, 词汇 数据概述: 该数据集包含用于写作质量评估的数据,记录了文本在多个维度上的评分结果。主要特征如下:... -
文本质量评估数据集_Text_Quality_Assessment_Dataset
文本质量评估数据集_Text_Quality_Assessment_Dataset 数据来源:互联网公开数据 标签:文本分析, 写作质量, 语言模型, 文本特征, 机器学习, 文本评估, 自然语言处理, 交叉验证 数据概述: 该数据集包含多个CSV文件,每个文件对应一个交叉验证折叠(cross-validation... -
机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison
机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 语言模型, 文本对比, 模型评估, 自然语言处理, 文本校对, 对比分析 数据概述:... -
YouTube视频字幕数据集-印地文与英文-2023
YouTube视频字幕数据集-印地文与英文-2023 数据来源:互联网公开数据 标签:YouTube,字幕,印地文,英文,视频数据,机器学习,语言模型,分类,摘要,翻译 数据概述:... -
中国医疗对话智能健康语言模型训练数据集-thedevastator
中国医疗对话智能健康语言模型训练数据集-thedevastator 数据来源:互联网公开数据 标签:医疗对话,智能医疗,深度学习,健康,数据集,语言模型,对话系统 数据概述:... -
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav 数据来源:互联网公开数据 标签:语音识别,呼叫中心,语音数据,ASR,性能评估,自然语言处理,声学模型,语言模型 数据概述: 本数据集“ASR Calls 2 Val”包含了从呼叫中心收集的语音数据,主要用于评估语音识别(ASR, Automatic Speech... -
自然语言处理多领域对话数据集UltraChat-200K-thedevastator
自然语言处理多领域对话数据集UltraChat-200K-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,对话,生成,训练,文本,语言模型,NLG,语料库 数据概述:... -
Tashkeela清理阿拉伯语带音符语料库
Tashkeela清理阿拉伯语带音符语料库 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,文本清洗,语音标注,语言模型,机器学习,数据标注 数据概述:... -
GPT角色扮演领域增强角色扮演数据集
GPT角色扮演领域增强角色扮演数据集 数据来源:互联网公开数据 标签:角色扮演,增强现实,语言模型,对话生成,虚拟人物,故事创作,互动游戏 数据概述:... -
孟加拉语新闻语料库数据集
孟加拉语新闻语料库数据集 数据来源:互联网公开数据 标签:新闻,孟加拉语,文本分类,语言模型,文本生成,关系抽取,命名实体识别,词性标注 数据概述:... -
-
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源:互联网公开数据 标签:自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型 数据概述:... -
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源:互联网公开数据 标签:语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集 数据概述:... -
OpenHermesGPT-4生成数据分析与应用数据集-thedevastator
OpenHermesGPT-4生成数据分析与应用数据集-thedevastator 数据来源:互联网公开数据 标签:GPT-4, 自然语言处理, AI, 数据集, 文本生成, 机器学习, OpenHermes, Huggingface, 语言模型 数据概述:... -
小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集
小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 模型训练, GPT-4, GPT-3.5, 语言模型, 文本增强, OpenOrca, 子集 数据概述: 本数据集是原始OpenOrca数据集的一个子集,OpenOrca数据集是一个由增强的FLAN... -
土耳其新闻摘要句子数据集-serdarcaglar
土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:... -
大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator
大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator 数据来源:互联网公开数据 标签:大规模数据集,偏好数据,语言模型,人工智能,奖励模型,评论模型,机器学习,训练数据,教育,研究 数据概述:... -
文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash
文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 机器学习, 文本生成, 情感分析, 语言模型, 数据标注, 语料库 数据概述:...