找到11,118个数据集

标签: TXT

过滤结果
  • 水体环境监测数据集WaterTemperature-Salinity-pHwithCoordinatesDataset-ahmadassaleh

    2025年4月24日   

    水体环境监测数据集WaterTemperature-Salinity-pHwithCoordinatesDataset-ahmadassaleh 数据来源:互联网公开数据 标签:水质监测,海洋学,环境科学,数据集,水温,盐度,pH值,地理坐标 数据概述:...
    packageimg
  • 英国航空评论数据集BritishAirwaysReviewsDataset-sujaykapadnis

    2025年4月24日   

    英国航空评论数据集BritishAirwaysReviewsDataset-sujaykapadnis 数据来源:互联网公开数据 标签:航空,用户评论,情感分析,数据集,自然语言处理,客户体验,服务质量,文本挖掘 数据概述: 该数据集包含了来自互联网的英国航空公司(British...
    packageimg
  • 乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed

    2025年4月24日   

    乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed 数据来源:互联网公开数据 标签:乌克兰危机,法国,政治言论,文本分析,情感分析,舆情分析,自然语言处理,国际关系 数据概述:...
    packageimg
  • 孟加拉语虚假新闻分类数据集-hakim11

    2025年4月24日   

    孟加拉语虚假新闻分类数据集-hakim11 数据来源:互联网公开数据 标签:虚假新闻,孟加拉语,自然语言处理,文本分类,机器学习,新闻分析,语言学,情感分析 数据概述:该数据集包含孟加拉语的虚假新闻文本,用于进行虚假新闻的检测与分类。主要特征如下: 时间跨度:数据收集的时间范围不明确,但包含了近期发布的新闻。...
    packageimg
  • 拉曼光谱糖尿病检测数据集-uyentruong

    2025年4月24日   

    拉曼光谱糖尿病检测数据集-uyentruong 数据来源:互联网公开数据 标签:糖尿病,拉曼光谱,医学,数据集,光谱分析,机器学习,疾病诊断,生物医学工程 数据概述: 该数据集包含通过拉曼光谱技术获得的用于糖尿病检测的原始数据。主要特征如下: 时间跨度: 数据记录的时间范围为特定研究期间。 地理范围: 数据来源于特定医疗机构或研究项目。 数据维度:...
    packageimg
  • arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso

    2025年4月24日   

    arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso 数据来源:互联网公开数据 标签:自然语言处理,机器学习,论文摘要,文本分析,数据集,学术研究,论文推荐,深度学习 数据概述: 该数据集包含来自arXiv(预印本服务器)的论文摘要数据,主要用于自然语言处理,机器学习等相关研究。主要特征如下:...
    packageimg
  • 独立开发者访谈与调查数据集Indiehackers6-Nov-2020Dataset-anlklc

    2025年4月24日   

    独立开发者访谈与调查数据集Indiehackers6-Nov-2020Dataset-anlklc 数据来源:互联网公开数据 标签:创业,开发者,访谈,调查,数据分析,商业模式,产品开发,市场研究...
    packageimg
  • 平衡原始大数据集BalancedRawBigDataset-mahmoudabusaqer

    2025年4月24日   

    平衡原始大数据集BalancedRawBigDataset-mahmoudabusaqer 数据来源:互联网公开数据 标签:大数据,数据集,数据平衡,数据挖掘,机器学习,统计分析,数据科学,数据预处理 数据概述: 该数据集包含来自多个来源的平衡原始数据,记录了大量未经过深度处理的原始数据。主要特征如下:...
    packageimg
  • 国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn

    2025年4月24日   

    国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源:互联网公开数据 标签:法律文本,信息检索,图卷积网络,数据集,自然语言处理,机器学习,法律科技,文本分析 数据概述: 该数据集来源于国际法律信息检索竞赛(COLIEE...
    packageimg
  • PDF文档摘要提取数据集DrivePDFDataset-atif10

    2025年4月24日   

    PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...
    packageimg
  • 口述历史访谈记录数据集LokisTranscriptDataset-anomic

    2025年4月24日   

    口述历史访谈记录数据集LokisTranscriptDataset-anomic 数据来源:互联网公开数据 标签:口述历史,访谈记录,数据集,历史研究,文本分析,社会研究,语言处理,人文科学 数据概述:该数据集包含来自口述历史项目的访谈记录,记录了个人口述历史访谈的完整文本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 市场篮子分析数据集MarketBasketAnalysisDataset-valton

    2025年4月24日   

    市场篮子分析数据集MarketBasketAnalysisDataset-valton 数据来源:互联网公开数据 标签:市场篮子分析,购物篮,关联规则,数据集,零售业,购物行为,数据挖掘,商业智能 数据概述: 该数据集包含来自零售商店的交易数据,记录了顾客的购物篮信息,主要用于市场篮子分析。主要特征如下:...
    packageimg
  • 英法翻译数据集English-FrenchTranslationDataset-endofnight17j03

    2025年4月24日   

    英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...
    packageimg
  • KaggleREADME文件文档数据集-rejent

    2025年4月24日   

    KaggleREADME文件文档数据集-rejent 数据来源:互联网公开数据 标签:文档,数据集,Kaggle,元数据,数据清洗,数据分析,机器学习,自然语言处理 数据概述: 该数据集包含Kaggle平台上README文档的元数据和文本内容,用于数据科学和机器学习研究。主要特征如下:...
    packageimg
  • 突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah

    2025年4月24日   

    突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah 数据来源:互联网公开数据 标签:短信,垃圾邮件,文本分类,自然语言处理,机器学习,阿拉伯语,数据集,文本分析 数据概述: 该数据集包含了来自突尼斯的短信数据,用于垃圾短信(Spam)和正常短信(Ham)的分类研究。主要特征如下:...
    packageimg
  • SIAM-SES句子相似度数据集0-50-2-emam2002

    2025年4月24日   

    SIAM-SES句子相似度数据集0-50-2-emam2002 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,语义分析,机器学习,中文,情感分析,文本匹配 数据概述: 该数据集包含来自 SIAM-SES 的中文句子对,用于评估句子间的语义相似度。主要特征如下: 时间跨度:数据记录时间不明确,但数据集本身为静态数据。...
    packageimg
  • 阿拉伯方言数据集DialectArabicDataset-arawee

    2025年4月24日   

    阿拉伯方言数据集DialectArabicDataset-arawee 数据来源:互联网公开数据 标签:阿拉伯语,方言研究,数据集,语言分析,机器学习,自然语言处理,语音识别,文化研究 数据概述: 该数据集包含来自多个阿拉伯国家的方言语音和文本数据,记录了阿拉伯语在不同地区的方言特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 鱼类图像描述生成数据集FishDescriptorVAEModelData-leilang

    2025年4月24日   

    鱼类图像描述生成数据集FishDescriptorVAEModelData-leilang 数据来源:互联网公开数据 标签:鱼类,图像描述,变分自编码器,数据集,计算机视觉,自然语言处理,生物学,机器学习 数据概述: 该数据集包含用于训练和评估基于变分自编码器(VAE)的鱼类图像描述生成模型的数据。主要特征如下:...
    packageimg
  • 马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav

    2025年4月24日   

    马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,马拉地语,文本挖掘,机器学习,语言学,印度文化 数据概述: 该数据集包含了马拉地语文本及其对应的情感标签,用于情感分析模型的训练和评估。主要特征如下:...
    packageimg
  • 耶拿气候数据集2009-2016-selcukcan

    2025年4月24日   

    耶拿气候数据集2009-2016-selcukcan 数据来源:互联网公开数据 标签:气候数据,气象数据,时间序列,温度,湿度,机器学习,环境科学,德国 数据概述:该数据集包含来自德国耶拿市的气候数据,记录了2009年至2016年期间的天气状况。主要特征如下: 时间跨度:数据记录的时间范围为2009年至2016年。 地理范围:数据覆盖德国耶拿市。...
    packageimg