找到13,153个数据集

标签: TXT

过滤结果
  • 歌词清洗与预处理数据集-kalyanitewari

    2025年5月29日   

    歌词清洗与预处理数据集-kalyanitewari 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,数据集,情感分析,音乐,数据清洗,中文 数据概述: 该数据集包含了经过清洗和预处理的歌词数据,旨在为自然语言处理和文本分析任务提供高质量的文本资源。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了不同年代的歌词。...
    packageimg
  • PyTorch深度学习代码及相关文件数据集PyTorchDeepLearningCodeandRelatedFiles-mwangiwambugu

    2025年5月29日   

    PyTorch深度学习代码及相关文件数据集PyTorchDeepLearningCodeandRelatedFiles-mwangiwambugu 数据来源:互联网公开数据 标签:PyTorch, 深度学习, 代码, Python, 模型, 训练, 数据集, 计算机视觉 数据概述:...
    packageimg
  • 机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy

    2025年5月29日   

    机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-...
    packageimg
  • 文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal

    2025年5月29日   

    文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:...
    packageimg
  • 电子邮件钓鱼检测数据集-dhruvagarwal433

    2025年5月29日   

    电子邮件钓鱼检测数据集-dhruvagarwal433 数据来源:互联网公开数据 标签:电子邮件,钓鱼检测,网络安全,机器学习,自然语言处理,文本分析,恶意软件,欺诈 数据概述: 该数据集包含了用于电子邮件钓鱼检测的数据,旨在帮助研究人员和安全专家开发和评估钓鱼邮件的识别技术。主要特征如下:...
    packageimg
  • 电影剧本数据分析集MovieScriptDataset-saurabh502

    2025年5月29日   

    电影剧本数据分析集MovieScriptDataset-saurabh502 数据来源:互联网公开数据 标签:电影剧本,数据分析,文本挖掘,自然语言处理,电影研究,剧本写作,文学分析,文化产业 数据概述: 该数据集包含来自多个来源的电影剧本数据,记录了多部电影的剧本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 离子净化过程参数数据集-radream

    2025年5月29日   

    离子净化过程参数数据集-radream 数据来源:互联网公开数据 标签:离子净化,数据集,工艺优化,过程控制,机器学习,化工,数据分析,工业应用 数据概述:该数据集包含来自离子净化过程的详细参数记录,用于研究和优化离子净化工艺。主要特征如下: 时间跨度:数据记录的时间范围为不定,取决于实际操作中的数据采集。...
    packageimg
  • Gemma2模型微调数据集-anshdarji

    2025年5月29日   

    Gemma2模型微调数据集-anshdarji 数据来源:互联网公开数据 标签:大语言模型,微调,数据集,自然语言处理,文本生成,机器学习,人工智能,Gemma 数据概述:该数据集包含了用于微调 Gemma 2 模型的数据,旨在提升模型在特定任务上的表现。主要特征如下: 时间跨度:数据生成时间随数据集内容而异,涵盖不同时间段的文本信息。...
    packageimg
  • 英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg

    2025年5月29日   

    英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,数据集,语言模型,文本生成,语义分析,人工智能 数据概述:...
    packageimg
  • 心电图ECG数据分析数据集MIT-BIHNormalECG30-SecondsDataset-nitinborhade

    2025年5月29日   

    心电图ECG数据分析数据集MIT-BIHNormalECG30-SecondsDataset-nitinborhade 数据来源:互联网公开数据 标签:心电图,ECG,医学,数据集,心律失常,信号处理,机器学习,健康 数据概述: 该数据集包含来自MIT-BIH心律失常数据库的正常心电图数据,记录了30秒的心电信号。主要特征如下:...
    packageimg
  • 大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis

    2025年5月29日   

    大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,预训练,数据集,文本数据,深度学习,语言模型,人工智能 数据概述: 该数据集包含了用于大规模语言模型(LLM)预训练的文本数据,旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下: 时间跨度:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92

    2025年5月29日   

    IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,文本挖掘,机器学习,情感分类,NLP 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • BotezLive直播聊天记录分类数据集-brandonbenton

    2025年5月29日   

    BotezLive直播聊天记录分类数据集-brandonbenton 数据来源:互联网公开数据 标签:直播聊天,文本分类,数据集,机器学习,自然语言处理,游戏直播,社区互动,情感分析 数据概述: 该数据集包含了 BotezLive 直播平台的聊天记录,旨在用于文本分类和情感分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了...
    packageimg
  • 人脸识别Siamese网络训练数据集FacialRecognitionSiameseNetworkTrainingDataset-fangfeng11

    2025年5月29日   

    人脸识别Siamese网络训练数据集FacialRecognitionSiameseNetworkTrainingDataset-fangfeng11 数据来源:互联网公开数据 标签:人脸识别, Siamese网络, 图像识别, 深度学习, 数据集构建, 计算机视觉, 模型训练, 特征提取 数据概述: 该数据集包含用于训练人脸识别 Siamese...
    packageimg
  • 多元数据集综合分析与应用MultifacetedDatasetsAnalysisandApplication-jafarib

    2025年5月29日   

    多元数据集综合分析与应用MultifacetedDatasetsAnalysisandApplication-jafarib 数据来源:互联网公开数据 标签:多元数据, 统计分析, 数据挖掘, 机器学习, 预测模型, 商业分析, 社会科学, 经济学 数据概述:...
    packageimg
  • 自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater

    2025年5月29日   

    自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,机器翻译,项目复现 数据概述: 该数据集旨在为自然语言处理(NLP)项目复现提供数据支持,包含多种文本类型和任务的数据集。主要特征如下: 时间跨度:...
    packageimg
  • 语音识别与自然语言处理对话数据集SAMVAAD-HIV1-GEMMADataset-harveenchadha

    2025年5月29日   

    语音识别与自然语言处理对话数据集SAMVAAD-HIV1-GEMMADataset-harveenchadha 数据来源:互联网公开数据 标签:语音识别,自然语言处理,对话系统,数据集,机器学习,语音合成,多语言处理,人工智能 数据概述: 该数据集来自SAMVAAD-HI...
    packageimg
  • 餐厅评论情感分析数据集RestaurantReviewSentimentAnalysisDataset-sree1ekha

    2025年5月29日   

    餐厅评论情感分析数据集RestaurantReviewSentimentAnalysisDataset-sree1ekha 数据来源:互联网公开数据 标签:餐厅,评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感分类 数据概述:该数据集包含来自不同餐厅的评论数据,记录了顾客对餐厅的评价。主要特征如下:...
    packageimg
  • 体内测试数据数据集-shourovj

    2025年5月29日   

    体内测试数据数据集-shourovj 数据来源:互联网公开数据 标签:医学,临床试验,数据集,生物医学,药物研发,数据分析,生物统计学,健康 数据概述: 该数据集包含体内(in vivo)测试数据,记录了在生物体内进行的实验结果。主要特征如下: 时间跨度:数据记录的时间范围可能取决于具体的实验设计,通常包括实验的开始和结束时间。...
    packageimg
  • 金融指令数据集SujetoFinanceInstructDataset-tnglmng

    2025年5月29日   

    金融指令数据集SujetoFinanceInstructDataset-tnglmng 数据来源:互联网公开数据 标签:金融,自然语言处理,指令数据,机器学习,数据集,文本分析,深度学习,语言模型 数据概述: 该数据集包含来自金融领域的指令数据,记录了金融场景中的各种指令和任务描述。主要特征如下:...
    packageimg