找到12,398个数据集

标签: TXT

过滤结果
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg
  • 跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

    2025年4月23日   

    跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:...
    packageimg
  • 刑事审判案例数据集TRECTrialDataExampleDataset-cryosky

    2025年4月23日   

    刑事审判案例数据集TRECTrialDataExampleDataset-cryosky 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,案例分析,机器学习,文本分析,法律科技,司法统计 数据概述: 该数据集包含来自刑事审判案例的文本数据,记录了案件的基本信息,审判过程和法律判决。主要特征如下:...
    packageimg
  • 医疗健康糖尿病数据自动标注数据集HealthDBTSATSDataset-joaogabrieln

    2025年4月22日   

    医疗健康糖尿病数据自动标注数据集HealthDBTSATSDataset-joaogabrieln 数据来源:互联网公开数据 标签:医疗健康,糖尿病,数据集,自动标注,机器学习,医学影像,疾病诊断,自然语言处理 数据概述: 该数据集包含来自医疗机构的糖尿病患者相关数据,并结合了自动标注信息,旨在支持糖尿病诊断,治疗和研究。主要特征如下:...
    packageimg
  • YOLOv7目标检测子集数据集-lintusub

    2025年4月22日   

    YOLOv7目标检测子集数据集-lintusub 数据来源:互联网公开数据 标签:目标检测,YOLOv7,数据集,图像识别,深度学习,计算机视觉,物体检测,人工智能 数据概述: 该数据集是基于YOLOv7目标检测模型构建的子集,主要用于目标检测任务的训练和评估。主要特征如下: 时间跨度:数据的时间范围取决于原始数据集,通常包含近期图像数据。...
    packageimg
  • 越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx

    2025年4月22日   

    越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:...
    packageimg
  • 圣经文本数据集-vishnuprksh

    2025年4月22日   

    圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。...
    packageimg
  • 古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra

    2025年4月22日   

    古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra 数据来源:互联网公开数据 标签:古兰经,印尼语,翻译,宗教,文本分析,自然语言处理,伊斯兰教,数据集 数据概述: 该数据集包含来自印尼语翻译的古兰经文本,记录了古兰经经文的印尼语翻译内容。主要特征如下:...
    packageimg
  • 尼日利亚政治新闻真伪鉴别数据集-nevilmaloba

    2025年4月22日   

    尼日利亚政治新闻真伪鉴别数据集-nevilmaloba 数据来源:互联网公开数据 标签:政治新闻,虚假新闻,尼日利亚,数据集,文本分析,自然语言处理,信息真实性,新闻分类 数据概述: 该数据集包含了来自尼日利亚的政治新闻,旨在用于研究和分析新闻的真伪。主要特征如下: 时间跨度:数据记录的时间范围为特定时期内。 地理范围:数据主要来源于尼日利亚。...
    packageimg
  • 键盘记录数据安全事件数据集KeyloggingDataset-razasiddique

    2025年4月22日   

    键盘记录数据安全事件数据集KeyloggingDataset-razasiddique 数据来源:互联网公开数据 标签:键盘记录,数据集,安全事件,恶意软件,网络安全,数据分析,机器学习,隐私保护 数据概述: 该数据集包含了键盘记录相关的安全事件数据,旨在用于研究和分析键盘记录行为,以及相关的安全风险。主要特征如下:...
    packageimg
  • 突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi

    2025年4月22日   

    突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:...
    packageimg
  • IBM电子设计自动化数据集EDADataset-javeriaferoz

    2025年4月22日   

    IBM电子设计自动化数据集EDADataset-javeriaferoz 数据来源:互联网公开数据 标签:电子设计自动化,EDA,数据集,芯片设计,机器学习,数据分析,硬件设计,人工智能 数据概述: 该数据集由IBM提供,包含了用于电子设计自动化(EDA)领域的数据,旨在支持芯片设计和优化流程。主要特征如下:...
    packageimg
  • API调用数据分析数据集-lordhim

    2025年4月22日   

    API调用数据分析数据集-lordhim 数据来源:互联网公开数据 标签:API调用,数据集,数据分析,日志分析,API管理,性能监控,软件工程,云服务 数据概述: 该数据集包含API调用行为的数据,记录了API的调用请求与响应信息。主要特征如下: 时间跨度:数据记录的时间范围,如最近一年或更长。 地理范围:数据覆盖的范围,如全球范围或特定地区。...
    packageimg
  • K折交叉验证数据集-theintegratedguy

    2025年4月22日   

    K折交叉验证数据集-theintegratedguy 数据来源:互联网公开数据 标签:机器学习,交叉验证,数据集,模型评估,统计学,数据科学,模型训练,算法优化 数据概述: 该数据集包含用于K折交叉验证(K-fold Cross-Validation)的数据,旨在评估和优化机器学习模型的性能。主要特征如下: 时间跨度:数据不涉及时间跨度,为通用数据集。...
    packageimg
  • 大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q

    2025年4月22日   

    大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:...
    packageimg
  • 全球抗议活动关键词数据集GDELTUnrestSAKeywordsDataset-liadperetz

    2025年4月22日   

    全球抗议活动关键词数据集GDELTUnrestSAKeywordsDataset-liadperetz 数据来源:互联网公开数据 标签:抗议活动,关键词,全球,事件分析,文本挖掘,自然语言处理,社会学,政治学 数据概述: 该数据集基于全球事件,语言和趋势数据库(GDELT),包含了与全球抗议活动相关的关键词信息。主要特征如下:...
    packageimg
  • 埃博拉-疟疾-脑膜炎文本挖掘数据集-kandahugues

    2025年4月22日   

    埃博拉-疟疾-脑膜炎文本挖掘数据集-kandahugues 数据来源:互联网公开数据 标签:文本挖掘,疾病,埃博拉,疟疾,脑膜炎,医学,自然语言处理,疫情分析 数据概述: 该数据集包含了关于埃博拉,疟疾和脑膜炎三种疾病的文本数据,旨在用于文本挖掘和信息提取研究。主要特征如下:...
    packageimg
  • 孟加拉语命名实体识别数据集-koushikdeb

    2025年4月22日   

    孟加拉语命名实体识别数据集-koushikdeb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,孟加拉语,数据集,语言学,文本分析,机器学习,NLP 数据概述: 该数据集包含孟加拉语文本,用于命名实体识别(NER)任务。主要特征如下: 时间跨度: 数据集未明确时间范围,但涵盖了不同年代和主题的文本。 地理范围:...
    packageimg
  • 数据2016年日本松代福岛地震数据集2016FukushimaEarthquakeMatsushiroJapanDataset-protobioengineering

    2025年4月22日   

    2016年日本松代福岛地震数据集2016FukushimaEarthquakeMatsushiroJapanDataset-protobioengineering 数据来源:互联网公开数据 标签:地震,自然灾害,数据集,地质研究,灾害分析,日本,时间序列,应急响应 数据概述:...
    packageimg
  • 泰国图像描述数据集ThaiCaptionDataset-blacksilva

    2025年4月22日   

    泰国图像描述数据集ThaiCaptionDataset-blacksilva 数据来源:互联网公开数据 标签:图像描述,计算机视觉,自然语言处理,数据集,机器学习,视觉识别,多模态学习,人工智能 数据概述: 该数据集包含来自泰国地区的图像及其对应的泰文描述文本,记录了图像内容与泰文描述之间的关联。主要特征如下:...
    packageimg