找到11,489个数据集

标签: TXT

过滤结果
  • 电影标题-评分-摘要与情节数据集-arnavsharmaas

    2025年4月25日   

    电影标题-评分-摘要与情节数据集-arnavsharmaas 数据来源:互联网公开数据 标签:电影,评分,摘要,情节,文本分析,情感分析,电影评论,自然语言处理 数据概述: 该数据集包含电影的标题,评分,摘要和情节概要信息。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
    packageimg
  • 拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais

    2025年4月25日   

    拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

    2025年4月25日   

    BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
    packageimg
  • ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi

    2025年4月25日   

    ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi 数据来源:互联网公开数据 标签:医疗健康,ICD-10,文本挖掘,自然语言处理,疾病诊断,医疗数据分析,机器学习,临床研究 数据概述:...
    packageimg
  • CS5228课程辅助训练数据集-likeqi

    2025年4月25日   

    CS5228课程辅助训练数据集-likeqi 数据来源:互联网公开数据 标签:机器学习,数据集,图像识别,计算机视觉,深度学习,学术资源,图像分类,数据集增强 数据概述: 该数据集是新加坡国立大学(NUS)CS5228 课程的辅助训练数据集,用于支持学生进行图像识别相关的机器学习项目。主要特征如下:...
    packageimg
  • DACON语言翻译输出数据集-geying

    2025年4月25日   

    DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。...
    packageimg
  • HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74

    2025年4月25日   

    HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
    packageimg
  • 虚拟文件数据集DummyFilesDataset-zubairahmadmir

    2025年4月25日   

    虚拟文件数据集DummyFilesDataset-zubairahmadmir 数据来源:互联网公开数据 标签:虚拟数据,数据集,模拟文件,测试数据,数据验证,数据模拟,数据分析,数据管理 数据概述: 该数据集包含一系列虚拟文件数据,用于模拟真实场景中的数据文件,适用于测试,验证和分析等任务。主要特征如下:...
    packageimg
  • 互联网电影数据库IMDb电影评论数据集-endofnight17j03

    2025年4月25日   

    互联网电影数据库IMDb电影评论数据集-endofnight17j03 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,数据集,影评,电影 数据概述:该数据集包含来自互联网电影数据库(IMDb)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
    packageimg
  • 推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta

    2025年4月25日   

    推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:...
    packageimg
  • 简历数据分析数据集ResumeDataAnalysisDataset-someetsingh

    2025年4月25日   

    简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
    packageimg
  • 预处理输入数据数据集-isabbaggin

    2025年4月25日   

    预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。...
    packageimg
  • 旅行商问题城市列表数据集TSPCityListDataset-vikawenzel

    2025年4月25日   

    旅行商问题城市列表数据集TSPCityListDataset-vikawenzel 数据来源:互联网公开数据 标签:旅行商问题,TSP,数据集,城市列表,优化算法,运筹学,算法竞赛,地理信息 数据概述: 该数据集包含了用于解决旅行商问题(TSP)的城市坐标数据。主要特征如下: 时间跨度:数据记录的时间范围不定,主要用于静态的城市地理位置描述。...
    packageimg
  • 集体意见垃圾邮件检测数据集-samygithub

    2025年4月25日   

    集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:...
    packageimg
  • 路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch

    2025年4月24日   

    路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:...
    packageimg
  • 广岛和长崎和平宣言演讲数据集HiroshimaandNagasakiPeaceDeclarationSpeechDataset-kenyaguchi

    2025年4月24日   

    广岛和长崎和平宣言演讲数据集HiroshimaandNagasakiPeaceDeclarationSpeechDataset-kenyaguchi 数据来源:互联网公开数据 标签:历史文献,和平宣言,核武器,数据集,演讲分析,国际关系,社会研究,公共演讲...
    packageimg
  • 高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam

    2025年4月24日   

    高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:...
    packageimg
  • 西安交通大学SY数据集XJTU-SYDataset-zhenxinchen

    2025年4月24日   

    西安交通大学SY数据集XJTU-SYDataset-zhenxinchen 数据来源:互联网公开数据 标签:轴承故障,数据集,机械故障诊断,振动信号,机器学习,工业大数据,信号处理,故障诊断 数据概述:...
    packageimg
  • 脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1

    2025年4月24日   

    脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。...
    packageimg