找到12,768个数据集

标签: TXT

过滤结果
  • 预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita

    2025年4月26日   

    预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita 数据来源:互联网公开数据 标签:自然语言处理,词向量,Word2Vec,数据集,文本分析,机器学习,深度学习,语义分析 数据概述:...
    packageimg
  • 光学字符识别数据集OCR-DSCTextDataset-hhhoang

    2025年4月26日   

    光学字符识别数据集OCR-DSCTextDataset-hhhoang 数据来源:互联网公开数据 标签:光学字符识别,文本数据,数据集,机器学习,图像处理,自然语言处理,计算机视觉,文档分析 数据概述: 该数据集专注于光学字符识别(OCR)任务,包含大量文本图像数据,用于训练和评估OCR系统的性能。主要特征如下:...
    packageimg
  • 孟加拉语电影评论情感分析数据集-dhrubachakraborty

    2025年4月26日   

    孟加拉语电影评论情感分析数据集-dhrubachakraborty 数据来源:互联网公开数据 标签:情感分析,文本挖掘,孟加拉语,电影评论,自然语言处理,数据集,机器学习,情感分类 数据概述: 该数据集包含了来自孟加拉语电影评论的数据,记录了观众对电影的情感反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了近年来孟加拉语电影的评论。...
    packageimg
  • 国际信息学奥林匹克竞赛结果数据集IOIResultsDataset-motloch

    2025年4月26日   

    国际信息学奥林匹克竞赛结果数据集IOIResultsDataset-motloch 数据来源:互联网公开数据 标签:信息学竞赛,IOI,编程竞赛,数据集,算法,计算机科学,教育,国际赛事 数据概述: 该数据集包含了国际信息学奥林匹克竞赛(IOI)的竞赛结果数据,记录了来自世界各地的参赛者的成绩和相关信息。主要特征如下:...
    packageimg
  • IDLN临时文件版本1数据集-suryajrrafl

    2025年4月26日   

    IDLN临时文件版本1数据集-suryajrrafl 数据来源:互联网公开数据 标签:图像处理,数据集,临时文件,文件分析,数据挖掘,计算机视觉,文件结构,信息安全 数据概述: 该数据集包含IDLN(图像深度学习网络)产生的临时文件数据,记录了图像处理过程中生成的中间文件和缓存数据。主要特征如下:...
    packageimg
  • 科学问答开放书本数据集LLM-Scientific-QA-with-OpenbookDataset-haykelbargougui

    2025年4月26日   

    科学问答开放书本数据集LLM-Scientific-QA-with-OpenbookDataset-haykelbargougui 数据来源:互联网公开数据 标签:科学问答,开放书本,自然语言处理,问答系统,机器学习,知识检索,文本理解,人工智能 数据概述: 该数据集包含科学领域的问答对,并附带了用于回答问题的相关开放书本内容。主要特征如下:...
    packageimg
  • 美国证券交易委员会SEC上市公司申报数据StockFilingData-soksotheara

    2025年4月26日   

    美国证券交易委员会SEC上市公司申报数据StockFilingData-soksotheara 数据来源:互联网公开数据 标签:证券市场,上市公司,财务数据,数据集,SEC,股票分析,投资,风险评估 数据概述:...
    packageimg
  • 越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat

    2025年4月26日   

    越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat 数据来源:互联网公开数据 标签:情感分析,越南语,自然语言处理,文本分类,机器学习,情感极性,数据集,语言学 数据概述:该数据集包含来自越南语文本的情感标注数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 摩洛哥达里贾语情感分析数据集-tariklemkadem

    2025年4月26日   

    摩洛哥达里贾语情感分析数据集-tariklemkadem 数据来源:互联网公开数据 标签:情感分析,达里贾语,自然语言处理,文本挖掘,数据集,机器学习,摩洛哥文化,语言学 数据概述: 该数据集包含了摩洛哥达里贾语文本数据,用于情感分析任务。主要特征如下: 时间跨度: 数据集未明确标注具体的时间跨度,但数据采集的时间与摩洛哥社交媒体的活跃时间相关。...
    packageimg
  • 纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers

    2025年4月26日   

    纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers 数据来源:互联网公开数据 标签:股票市场,公司描述,纳斯达克,文本分析,自然语言处理,金融数据,数据集,上市公司 数据概述:...
    packageimg
  • 医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa

    2025年4月26日   

    医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:...
    packageimg
  • 罗马数字到印地语转换数据集-dushyantsingh1

    2025年4月26日   

    罗马数字到印地语转换数据集-dushyantsingh1 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,印地语,罗马数字,文本转换,语言模型,印度文化 数据概述: 该数据集包含了罗马数字和对应的印地语数字的转换对,旨在促进罗马数字到印地语数字的自动转换。主要特征如下: 时间跨度:数据涵盖了现代罗马数字和印地语数字的表示。...
    packageimg
  • 讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298

    2025年4月26日   

    讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源:互联网公开数据 标签:讽刺,嘲讽,情感分析,自然语言处理,文本数据,机器学习,情感识别,语言学 数据概述: 该数据集包含了标注了讽刺和嘲讽情感的文本数据,旨在用于情感分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 语音识别与语言建模基准测试数据集SLURP-LB-SpeechRecognitionandLanguageModelingBenchmarkDataset-mrhakk

    2025年4月26日   

    语音识别与语言建模基准测试数据集SLURP-LB-SpeechRecognitionandLanguageModelingBenchmarkDataset-mrhakk 数据来源:互联网公开数据 标签:语音识别,语言建模,数据集,自然语言处理,深度学习,人工智能,基准测试,语音技术 数据概述: 该数据集包含来自SLURP-...
    packageimg
  • 印地语验证标记数据集HindiValidationTokensDataset-pranav51286

    2025年4月26日   

    印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:...
    packageimg
  • 跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11

    2025年4月26日   

    跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11 数据来源:互联网公开数据 标签:语音识别,情感分析,多语言,数据集,自然语言处理,机器学习,仇恨言论检测,语音数据 数据概述:...
    packageimg
  • 医疗健康文本语料库数据集CorpusHealthcareDataset-lthnhtin

    2025年4月26日   

    医疗健康文本语料库数据集CorpusHealthcareDataset-lthnhtin 数据来源:互联网公开数据 标签:医疗健康,文本数据,自然语言处理,医学研究,数据集,医疗信息,语义分析,文本挖掘 数据概述: 该数据集包含来自医疗健康领域的文本数据,旨在支持医学研究和自然语言处理任务。主要特征如下:...
    packageimg
  • 垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11

    2025年4月26日   

    垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源:互联网公开数据 标签:垃圾邮件,短信,自然语言处理,文本分类,机器学习,数据集,情感分析,信息安全 数据概述: 该数据集包含来自公开渠道的短信数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了收集数据的时期。...
    packageimg
  • 扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong

    2025年4月26日   

    扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong 数据来源:互联网公开数据 标签:数学竞赛,数据集,机器学习,自然语言处理,数学建模,问题解答,人工智能,文本分析 数据概述: 该数据集包含来自扎罗数学竞赛的题目和解答数据,用于支持数学问题解答,自然语言处理等任务。主要特征如下:...
    packageimg
  • 自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta

    2025年4月26日   

    自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:...
    packageimg