-
人工智能领域引用语数据集VyomAIQuotesDataset-ajax0564
人工智能领域引用语数据集VyomAIQuotesDataset-ajax0564 数据来源:互联网公开数据 标签:人工智能,引用语,数据集,自然语言处理,文本分析,机器学习,语言模型,知识图谱 数据概述: 该数据集包含来自人工智能领域的重要引用语和言论,记录了行业专家、学者和从业者的观点和见解。主要特征如下:... -
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 印度语, 英语, Hinglish, 语料库, 语言模型 数据概述:... -
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,数据集,语言模型,序列到序列,文本重述,人工智能 数据概述:该数据集包含用于优化下一句生成和同义改写的文本数据,记录了成对的原始句子和优化后的改写句子。主要特征如下:... -
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:... -
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:... -
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:... -
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,文本分析,人工智能,语言模型,数据标注 数据概述:... -
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,语言模型,数据预处理,文本分析,人工智能 数据概述:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,文本分析,深度学习,模型训练 数据概述: 该数据集包含经过筛选的大型语言模型(LLM)训练数据,记录了用于优化和训练语言模型的文本内容。主要特征如下:... -
写作质量特征工程数据集-mcpenguin
写作质量特征工程数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,特征工程,自然语言处理,数据集,文本分析,机器学习,语言模型,内容评估 数据概述: 该数据集包含了经过特征工程处理的文本数据,旨在用于评估和预测文本的写作质量。主要特征如下: 时间跨度: 数据集未明确标注时间跨度,但数据来源于不同时间段的文本内容。 地理范围:... -
跨编码器数据集Cross-EncoderDataset-epsilon12345
跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:... -
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,数据拆分,文本分析,人工智能,模型训练 数据概述: 该数据集为大型语言模型版本三(LLM V3)的数据集,按照数据来源进行拆分,记录了不同来源的文本数据。主要特征如下:... -
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本分类,语言模型,人工智能,文本挖掘 数据概述: 该数据集专注于包含讽刺语气的文本数据,记录了不同来源的文本内容,适用于讽刺文本识别和情感分析等任务。主要特征如下:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:嵌入向量,数据集,自然语言处理,机器学习,文本分析,深度学习,语言模型,语义理解 数据概述:该数据集包含来自PSPV5C模型的嵌入向量数据,记录了大量文本数据的语义表示。主要特征如下:... -
大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13
大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,人工智能,语言模型,模型微调 数据概述: 该数据集专注于大型语言模型(Large Language Model,... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 文本摘要, 语言模型, 数据集 数据概述: 该数据集包含来自阿拉伯语新闻文章及其对应的摘要。主要特征如下:...