-
数据480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99
480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,对比研究,语言模型,人工智能,数据集,文本生成 数据概述: 该数据集包含480万条文本数据,记录了人类与大型语言模型(LLM)生成的文本对比。主要特征如下:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19 数据来源:互联网公开数据 标签:新闻摘要, 马拉地语, 文本分析, 自然语言处理, 摘要生成, 文本匹配, 语言模型, 印度 数据概述: 该数据集包含来自马拉地语新闻报道的摘要和正文文本。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料库。... -
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本分析, 数据清洗, 文本分类, 自然语言处理, 数据质量, 语言模型, 语料库 数据概述: 该数据集包含来自越南语文本的数据,记录了文本的有效性评估结果。主要特征如下:... -
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara 数据来源:互联网公开数据 标签:文本生成, 学术写作, 论文写作, 机器写作, 文本评估, 自然语言处理, 写作质量, 语言模型 数据概述:... -
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 语音转录, 波斯语, 语音信号处理, 深度学习, 自然语言处理, 声学模型, 语言模型 数据概述: 该数据集包含来自公开渠道的波斯语语音数据及其对应的文本转录。主要特征如下:... -
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph 数据来源:互联网公开数据 标签:语音识别,文本纠错,越南语,声学模型,语言模型,自然语言处理,深度学习,转录文本 数据概述:... -
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15 数据来源:互联网公开数据 标签:文本生成, 汽车使用, 议论文, 语言模型, 自然语言处理, 数据集, 文本分析, 二元分类 数据概述:... -
孟加拉语数学推理与解题训练数据集-z4hiid
孟加拉语数学推理与解题训练数据集-z4hiid 数据来源:互联网公开数据 标签:孟加拉语,数学,推理,问题解决,链式思维,教育,语言模型,训练数据 数据概述: 本数据集旨在通过语言模型的帮助,使孟加拉语中的数学推理和问题解决任务的训练和评估更加简便和有效。数据集包含各种数学问题的详细解决方案,每个解决方案都采用链式思维(Chain-of-... -
英语写作质量评估数据集EnglishWritingQualityAssessment-harshaas07
英语写作质量评估数据集EnglishWritingQualityAssessment-harshaas07 数据来源:互联网公开数据 标签:英语写作, 文本质量, 语言评估, 自然语言处理, 文本分析, 机器学习, 写作评分, 语言模型 数据概述: 该数据集包含来自公开来源的英语写作文本,记录了不同作者的写作样本及其质量评估结果。主要特征如下:... -
英语完形填空测试题数据集EnglishClozeTestQuestions-noorsaeed
英语完形填空测试题数据集EnglishClozeTestQuestions-noorsaeed 数据来源:互联网公开数据 标签:完形填空, 英语学习, 文本分析, 语言测试, 词汇理解, 阅读理解, 英语考试, 语言模型 数据概述: 该数据集包含英语完形填空测试题目,记录了用于评估英语语言理解能力的结构化文本示例。主要特征如下:... -
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语语料库, 文本处理, 自然语言处理, 语料分析, 语言模型, 词汇对应 数据概述:... -
文本嵌入与词向量分析数据集TextEmbeddingandWordVectorAnalysisDataset-hkhnhduy
文本嵌入与词向量分析数据集TextEmbeddingandWordVectorAnalysisDataset-hkhnhduy 数据来源:互联网公开数据 标签:文本分析, 词向量, 嵌入模型, 自然语言处理, 深度学习, 语言模型, 数据可视化, 模型训练 数据概述:... -
文学作品作者身份识别文本数据集LiteraryAuthorIdentificationTextDataset-juanestrada12
文学作品作者身份识别文本数据集LiteraryAuthorIdentificationTextDataset-juanestrada12 数据来源:互联网公开数据 标签:文本分类, 作者识别, 文学分析, 自然语言处理, 语言模型, 情感分析, 机器学习, 数据集 数据概述:... -
英语写作生成文本检测数据集EnglishEssayGenerationTextDetection-miguelquiceno
英语写作生成文本检测数据集EnglishEssayGenerationTextDetection-miguelquiceno 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器写作, 自然语言处理, 虚假信息检测, 语言模型, 文本分类, 深度学习 数据概述:... -
写作评估文本数据集WritingAssessmentTextDataset-rixhabh
写作评估文本数据集WritingAssessmentTextDataset-rixhabh 数据来源:互联网公开数据 标签:写作评估, 文本分析, 论文写作, 自然语言处理, 文本生成, 语言模型, 教育, 写作技巧 数据概述: 该数据集包含来自写作评估比赛的数据,记录了学生根据特定提示所写的文章,以及对应的提示信息。主要特征如下:... -
中文文本相似度评测数据集ChineseTextSimilarityEvaluationDataset-deepbule123
中文文本相似度评测数据集ChineseTextSimilarityEvaluationDataset-deepbule123 数据来源:互联网公开数据 标签:文本相似度, 中文文本, 自然语言处理, 机器翻译, 文本匹配, 数据集, 语义分析, 语言模型 数据概述: 该数据集包含用于中文文本相似度评测的数据,其中包含待评估的中文句子。主要特征如下:... -
语言模型预训练与评估数据集LanguageModelPretrainingandEvaluationDataset-kunihikofurugori
语言模型预训练与评估数据集LanguageModelPretrainingandEvaluationDataset-kunihikofurugori 数据来源:互联网公开数据 标签:自然语言处理, 语言模型, 预训练, 文本评估, 深度学习, 机器学习, 文本分析, 语料库 数据概述:... -
印度语言文本语料库及语音学数据资源IndianLanguagesTextCorpusandPhoneticsDataResources-abhinavmaithil
印度语言文本语料库及语音学数据资源IndianLanguagesTextCorpusandPhoneticsDataResources-abhinavmaithil 数据来源:互联网公开数据 标签:自然语言处理, 文本语料库, 语音学, 印度语言, 机器翻译, 文本分析, 语言模型, 语音识别 数据概述:... -
图卢语言辅助任务数据集-2023-thedevastator
图卢语言辅助任务数据集-2023-thedevastator 数据来源:互联网公开数据 标签:Tulu语言,自然语言处理,辅助技术,机器学习,数据集,科学研究,语音识别,人工智能,语言模型 数据概述:...