找到12,973个数据集

标签: TXT

过滤结果
  • 代码混合数据集CodeMixData-shankhad

    2025年4月22日   

    代码混合数据集CodeMixData-shankhad 数据来源:互联网公开数据 标签:代码,编程,数据集,自然语言处理,机器学习,代码生成,多语言,软件工程 数据概述: 该数据集包含来自多种编程语言的代码片段和相关文本描述,旨在支持代码生成,代码理解和代码翻译等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要基于公开的代码库和文档。...
    packageimg
  • 垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe

    2025年4月22日   

    垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,机器学习,自然语言处理,邮件过滤,信息安全,朴素贝叶斯 数据概述: 该数据集包含大量的电子邮件数据,用于训练和测试垃圾邮件过滤模型。主要特征如下:...
    packageimg
  • 自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath

    2025年4月22日   

    自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath 数据来源:互联网公开数据 标签:自然语言处理,文本清洗,数据集,序列数据,机器学习,文本挖掘,数据预处理,低资源 数据概述:...
    packageimg
  • 隐私测试法律案例数据集-minhnguyendichnhat

    2025年4月22日   

    隐私测试法律案例数据集-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律案例,隐私保护,数据集,法律研究,隐私法,机器学习,自然语言处理,文本分析 数据概述: 该数据集包含来自不同来源的法律案例,主要涉及隐私保护相关的法律问题。主要特征如下: 时间跨度: 数据记录的时间范围为近年来,涵盖了最新的法律案例。 地理范围:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil

    2025年4月22日   

    社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,文本分析,机器学习,情感分析,舆情监测 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与分析。主要特征如下:...
    packageimg
  • 竞赛笔记数据集CompetitionNotebookDataset-walker1402

    2025年4月22日   

    竞赛笔记数据集CompetitionNotebookDataset-walker1402 数据来源:互联网公开数据 标签:竞赛数据,数据集,笔记分享,学术资源,机器学习,数据分析,教育支持,技能提升 数据概述: 该数据集包含来自各类竞赛的笔记和资料,记录了竞赛参与者的学习心得,解题思路和经验总结。主要特征如下:...
    packageimg
  • 边界框测试数据集BoundingBoxTestDataset-trnkhnhh

    2025年4月22日   

    边界框测试数据集BoundingBoxTestDataset-trnkhnhh 数据来源:互联网公开数据 标签:计算机视觉,边界框,数据集,目标检测,图像标注,机器学习,图像处理,人工智能 数据概述: 该数据集包含用于目标检测任务中的边界框标注数据,主要用于模型测试和评估。主要特征如下: 时间跨度:数据记录的时间范围为2010年至2022年。...
    packageimg
  • 全球GPT-1N外部模型评估数据集-sasrdw

    2025年4月22日   

    全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。...
    packageimg
  • 对话摘要数据集SAMSUM-jainikkhil

    2025年4月22日   

    对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker

    2025年4月22日   

    维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker 数据来源:互联网公开数据 标签:维基百科,文本数据,数据集,自然语言处理,机器学习,信息检索,知识图谱,数据挖掘 数据概述: 该数据集包含从维基百科提取的条目数据,记录了维基百科中各类主题的文本信息。主要特征如下:...
    packageimg
  • 推特垃圾信息检测数据集TweetSpamDetectionDataset-fahmisulthoni

    2025年4月22日   

    推特垃圾信息检测数据集TweetSpamDetectionDataset-fahmisulthoni 数据来源:互联网公开数据 标签:推特,垃圾信息,数据集,文本分类,自然语言处理,机器学习,社交媒体,网络安全 数据概述: 该数据集包含来自推特(Twitter)的推文数据,用于垃圾信息检测任务。主要特征如下:...
    packageimg
  • 网络热梗图片文字识别数据集-疫情与美国政治相关-2020至2023年-yogesh239

    2025年4月22日   

    网络热梗图片文字识别数据集-疫情与美国政治相关-2020至2023年-yogesh239 数据来源:互联网公开数据 标签:热梗,OCR,疫情,美国政治,图像识别,文本数据,社会现象,数据分析 数据概述:...
    packageimg
  • 柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep

    2025年4月22日   

    柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep 数据来源:互联网公开数据 标签:语音识别,高棉语,数据集,语音信号处理,自然语言处理,声学模型,语音合成,语言学 数据概述: 该数据集包含来自柬埔寨公共工程与运输部(MPWT)的高棉语语音数据,旨在用于语音识别,语音合成等研究。主要特征如下:...
    packageimg
  • 聚类分析练习数据集-hassanfiguigui

    2025年4月22日   

    聚类分析练习数据集-hassanfiguigui 数据来源:互联网公开数据 标签:聚类分析,数据集,机器学习,数据挖掘,无监督学习,模式识别,数据科学,算法实践 数据概述:该数据集包含用于聚类分析的简单练习数据,用于演示和实践聚类算法。主要特征如下: 时间跨度:数据记录无时间维度。 地理范围:数据无地理范围。...
    packageimg
  • 联邦基金有效利率数据集FederalFundsEffectiveRateDataset-sinyeesim

    2025年4月22日   

    联邦基金有效利率数据集FederalFundsEffectiveRateDataset-sinyeesim 数据来源:互联网公开数据 标签:利率,金融,经济,货币政策,数据集,时间序列,美联储,宏观经济 数据概述: 该数据集包含来自美联储的数据,记录了联邦基金有效利率的历史数据。主要特征如下: 时间跨度:数据记录的时间范围从1954年到近期。...
    packageimg
  • 图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar

    2025年4月22日   

    图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下:...
    packageimg
  • 可穿戴设备活动识别数据集WearableDeviceActivityRecognitionDataset-gayathrirajavelu

    2025年4月22日   

    可穿戴设备活动识别数据集WearableDeviceActivityRecognitionDataset-gayathrirajavelu 数据来源:互联网公开数据 标签:可穿戴设备,活动识别,数据集,机器学习,传感器数据,健康管理,人工智能,数据分析 数据概述:...
    packageimg
  • 大规模情感分析数据集LargeEmotionDataset-ubbarapusiri

    2025年4月22日   

    大规模情感分析数据集LargeEmotionDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,情感分类,情绪识别,中文文本 数据概述: 该数据集包含大规模的中文文本数据,用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的中文文本。...
    packageimg
  • 标准正态分布数据集Norm10FeaturesDataset-sunder20

    2025年4月22日   

    标准正态分布数据集Norm10FeaturesDataset-sunder20 数据来源:互联网公开数据 标签:统计学,数据集,正态分布,机器学习,数据分析,特征工程,概率论,数据生成 数据概述: 该数据集包含10个特征,每个特征均服从标准正态分布。主要特征如下: 时间跨度:数据为静态数据,不涉及时间维度。 地理范围:数据不涉及地理位置信息。...
    packageimg
  • 冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726

    2025年4月22日   

    冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726 数据来源:互联网公开数据 标签:文学作品,数据集,文本分析,数据分析,机器学习,自然语言处理,故事分析,小说研究 数据概述: 该数据集包含来自《冰与火之歌》系列文学作品的数据,记录了该系列小说的文本内容及相关元数据。主要特征如下:...
    packageimg