-
点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran
点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran 数据来源:互联网公开数据 标签:点击诱饵,标题生成,数据集,自然语言处理,文本分析,机器学习,语言模型,评估 数据概述:该数据集包含用于测试和评估大型语言模型(LLM)生成点击诱饵标题能力的文本数据。主要特征如下:... -
大型语言模型聊天机器人大赛LMSYSChatbotArena对话数据集LMSYSChatbotArenaConversationsDataset-arpit1bansal
大型语言模型聊天机器人大赛LMSYSChatbotArena对话数据集LMSYSChatbotArenaConversationsDataset-arpit1bansal 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,交互分析,竞技评估 数据概述: 该数据集源自LMSYS Chatbot... -
生成式数据集2000年GenerateDF2000-mandrilator
生成式数据集2000年GenerateDF2000-mandrilator 数据来源:互联网公开数据 标签:生成数据,数据集,机器学习,自然语言处理,文本生成,人工智能,数据科学,语言模型 数据概述:该数据集包含来自互联网的多样化文本数据,主要记录了2000年期间的文本信息,适用于生成式模型的训练和文本生成任务。主要特征如下:... -
罗马数字到印地语转换数据集-dushyantsingh1
罗马数字到印地语转换数据集-dushyantsingh1 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,印地语,罗马数字,文本转换,语言模型,印度文化 数据概述: 该数据集包含了罗马数字和对应的印地语数字的转换对,旨在促进罗马数字到印地语数字的自动转换。主要特征如下: 时间跨度:数据涵盖了现代罗马数字和印地语数字的表示。... -
印地语验证标记数据集HindiValidationTokensDataset-pranav51286
印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:... -
中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022
中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022 数据来源:互联网公开数据 标签:古典文学,诗歌,数据集,文本分析,自然语言处理,机器学习,文化研究,语言模型 数据概述: 该数据集包含来自中国古典诗歌的文本数据,记录了历代著名诗人的诗歌作品及其相关信息。主要特征如下:... -
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:... -
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:... -
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:... -
对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang
对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,文本摘要,机器学习,深度学习,语言模型,人工智能 数据概述:... -
人类与人工智能交互文本数据集HelloClaude-1000EssaysfromAnthropic-jisukim8873
人类与人工智能交互文本数据集HelloClaude-1000EssaysfromAnthropic-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,人工智能,文本数据,交互分析,机器学习,语言模型,深度学习,数据集 数据概述:... -
自然语言处理基础数据集NLPDataset1-kryusufkaya
自然语言处理基础数据集NLPDataset1-kryusufkaya 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,文本分类,情感分析,信息提取 数据概述: 该数据集包含来自互联网的公开文本数据,记录了多种自然语言处理任务的基础文本信息。主要特征如下: 时间跨度:数据记录的时间范围未明确标注,涵盖多个时间段。... -
大型语言模型讽刺识别测试数据集LLMSarcasmTestDataset-datasontran
大型语言模型讽刺识别测试数据集LLMSarcasmTestDataset-datasontran 数据来源:互联网公开数据 标签:自然语言处理,讽刺识别,数据集,机器学习,情感分析,文本分类,人工智能,语言模型 数据概述: 该数据集包含用于测试大型语言模型识别讽刺性文本的能力的数据,主要记录了带有标签的文本样本。主要特征如下:... -
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,孟加拉语,新闻,数据集,NLP,机器翻译,语言模型 数据概述: 该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了Prothom... -
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试... -
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp 数据来源:互联网公开数据 标签:人工智能,语言模型,文本数据,自然语言处理,机器学习,深度学习,数据集,多语言处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了大型语言模型(LLM)和人工智能(AI)生成的文本内容。主要特征如下:... -
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,文本对比,语言模型,人工智能,数据科学 数据概述:... -
大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni
大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni 数据来源:互联网公开数据 标签:人工智能,机器学习,数据集,自然语言处理,语言模型,深度学习,算法竞赛,应用研究 数据概述: 该数据集源自大型语言模型应用与机器学习挑战(LLMAO-ML... -
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本翻译,深度学习,语言模型,翻译研究,计算机科学 数据概述: 该数据集包含来自Spider项目的翻译数据,记录了多种语言之间的文本翻译对。主要特征如下:... -
对话数据集样本ConvoDatasetSample-rigveddesai
对话数据集样本ConvoDatasetSample-rigveddesai 数据来源:互联网公开数据 标签:对话,文本,自然语言处理,数据集,语言模型,情感分析,文本生成,聊天机器人 数据概述: 该数据集包含对话文本样本,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时间段的对话。...