找到12,398个数据集

标签: TXT

过滤结果
  • 童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari

    2025年4月25日   

    童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari 数据来源:互联网公开数据 标签:童话故事,文本分析,数据集,自然语言处理,文学研究,机器学习,故事分析,叙事学 数据概述: 该数据集包含来自多个来源的童话故事文本数据,记录了各类经典童话故事的完整内容和相关元数据。主要特征如下:...
    packageimg
  • 阿拉伯语讽刺文本数据集-farisalahmdi

    2025年4月25日   

    阿拉伯语讽刺文本数据集-farisalahmdi 数据来源:互联网公开数据 标签:阿拉伯语,讽刺,文本分析,自然语言处理,情感分析,语言学,机器学习,社交媒体 数据概述:该数据集包含了阿拉伯语的讽刺文本数据,主要来源于社交媒体平台,新闻网站等。主要特征如下: 时间跨度:数据记录的时间范围跨度不固定,取决于数据来源。...
    packageimg
  • 批处理输出转换数据集BatchOutputConvertingDataset-lordix

    2025年4月25日   

    批处理输出转换数据集BatchOutputConvertingDataset-lordix 数据来源:互联网公开数据 标签:批处理,数据转换,文件格式,数据处理,机器学习,数据工程,自动化,Python 数据概述: 该数据集包含用于批处理输出转换任务的数据,记录了不同文件格式的转换过程和结果。主要特征如下:...
    packageimg
  • 大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan

    2025年4月25日   

    大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:...
    packageimg
  • 风格图像路径数据集-luna4444

    2025年4月25日   

    风格图像路径数据集-luna4444 数据来源:互联网公开数据 标签:图像处理,风格迁移,数据集,计算机视觉,深度学习,图像生成,艺术,图像合成 数据概述: 该数据集包含风格图像的路径信息,用于风格迁移等图像处理任务。主要特征如下: 时间跨度:数据无明确时间范围,主要收集不同时期,不同风格的图像。...
    packageimg
  • 移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri

    2025年4月25日   

    移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri 数据来源:互联网公开数据 标签:移动应用,用户评论,情感分析,自然语言处理,机器学习,文本挖掘,情感分类,应用商店 数据概述: 该数据集包含来自移动应用的用户评论数据,主要用于情感分析和用户反馈研究。主要特征如下: 时间跨度:...
    packageimg
  • 客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01

    2025年4月25日   

    客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01 数据来源:互联网公开数据 标签:客户支持,对话,文本分析,自然语言处理,机器学习,数据集,语义理解,客户服务 数据概述: 该数据集包含来自 Bitext 公司的客户支持对话文本,旨在用于训练和评估客户支持相关的自然语言处理模型。主要特征如下: 时间跨度:...
    packageimg
  • 文本摘要数据集TextSummarizationDataset-dngnguynanh12

    2025年4月25日   

    文本摘要数据集TextSummarizationDataset-dngnguynanh12 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,NLP,文本分析,信息检索 数据概述: 该数据集包含大量文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand

    2025年4月25日   

    LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand 数据来源:互联网公开数据 标签:大型语言模型,提示词,数据集,自然语言处理,信息检索,机器学习,文本分析,模型训练 数据概述: 该数据集包含了用于研究和开发大型语言模型(LLM)提示词恢复技术的数据。主要特征如下:...
    packageimg
  • 电影标题-评分-摘要与情节数据集-arnavsharmaas

    2025年4月25日   

    电影标题-评分-摘要与情节数据集-arnavsharmaas 数据来源:互联网公开数据 标签:电影,评分,摘要,情节,文本分析,情感分析,电影评论,自然语言处理 数据概述: 该数据集包含电影的标题,评分,摘要和情节概要信息。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
    packageimg
  • 拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais

    2025年4月25日   

    拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

    2025年4月25日   

    BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
    packageimg
  • ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi

    2025年4月25日   

    ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi 数据来源:互联网公开数据 标签:医疗健康,ICD-10,文本挖掘,自然语言处理,疾病诊断,医疗数据分析,机器学习,临床研究 数据概述:...
    packageimg
  • CS5228课程辅助训练数据集-likeqi

    2025年4月25日   

    CS5228课程辅助训练数据集-likeqi 数据来源:互联网公开数据 标签:机器学习,数据集,图像识别,计算机视觉,深度学习,学术资源,图像分类,数据集增强 数据概述: 该数据集是新加坡国立大学(NUS)CS5228 课程的辅助训练数据集,用于支持学生进行图像识别相关的机器学习项目。主要特征如下:...
    packageimg
  • DACON语言翻译输出数据集-geying

    2025年4月25日   

    DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。...
    packageimg
  • HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74

    2025年4月25日   

    HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
    packageimg
  • 虚拟文件数据集DummyFilesDataset-zubairahmadmir

    2025年4月25日   

    虚拟文件数据集DummyFilesDataset-zubairahmadmir 数据来源:互联网公开数据 标签:虚拟数据,数据集,模拟文件,测试数据,数据验证,数据模拟,数据分析,数据管理 数据概述: 该数据集包含一系列虚拟文件数据,用于模拟真实场景中的数据文件,适用于测试,验证和分析等任务。主要特征如下:...
    packageimg
  • 互联网电影数据库IMDb电影评论数据集-endofnight17j03

    2025年4月25日   

    互联网电影数据库IMDb电影评论数据集-endofnight17j03 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,数据集,影评,电影 数据概述:该数据集包含来自互联网电影数据库(IMDb)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
    packageimg
  • 推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta

    2025年4月25日   

    推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:...
    packageimg