找到743个数据集

标签: 语言模型

过滤结果
  • CommonLit英语文章摘要数据集-artisusxiren

    2025年4月22日   

    CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99

    2025年4月22日   

    语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:...
    packageimg
  • 大型语言模型偏见与真实性评估数据集-pallaviroyal

    2025年4月22日   

    大型语言模型偏见与真实性评估数据集-pallaviroyal 数据来源:互联网公开数据 标签:语言模型,偏见,真实性,评估,自然语言处理,机器学习,CrowS-Pairs,WinoGender,TruthfulQA 数据概述:...
    packageimg
  • 孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath

    2025年4月22日   

    孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本分析,机器学习,语言模型,数据集,文本分类,机器翻译 数据概述: 该数据集包含来自孟加拉语的段落文本数据,记录了孟加拉语的段落内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。...
    packageimg
  • 全球GPT-1N外部模型评估数据集-sasrdw

    2025年4月22日   

    全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。...
    packageimg
  • 对话摘要数据集SAMSUM-jainikkhil

    2025年4月22日   

    对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 提示生成数据集PromptsGeneratedV2Dataset-andreivanenko

    2025年4月22日   

    提示生成数据集PromptsGeneratedV2Dataset-andreivanenko 数据来源:互联网公开数据 标签:自然语言处理,提示生成,数据集,机器学习,文本生成,人工智能,语言模型,数据科学 数据概述: 该数据集包含来自Prompts Generated V2项目的提示生成数据,记录了用于训练和评估语言模型的提示文本。主要特征如下:...
    packageimg
  • 僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal

    2025年4月22日   

    僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:...
    packageimg
  • 杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh

    2025年4月22日   

    杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,模型训练,BART,文本匹配,语言模型,人工智能 数据概述: 该数据集包含杰布·普罗姆特(JB...
    packageimg
  • 文本可读性分析演示数据集-uocoeeds

    2025年4月22日   

    文本可读性分析演示数据集-uocoeeds 数据来源:互联网公开数据 标签:文本分析,可读性,自然语言处理,数据集,语言模型,文本挖掘,机器学习,教育 数据概述: 该数据集包含来自不同来源的文本数据,旨在用于评估和演示文本可读性分析方法。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的文本。...
    packageimg
  • 金融推文数据集-2021至2023年-amulyas

    2025年4月22日   

    金融推文数据集-2021至2023年-amulyas 数据来源:互联网公开数据 标签:金融推文,社交媒体,金融影响者,情感分析,语言模型,比特币,股票,市场趋势 数据概述:...
    packageimg
  • ChatGPT推特首月数据集2022年11月至12月-pcminh0505

    2025年4月22日   

    ChatGPT推特首月数据集2022年11月至12月-pcminh0505 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,人工智能,语言模型,科研,学术研究 数据概述: 本数据集包含了2022年11月30日至2022年12月31日期间,所有与ChatGPT相关的推特信息。数据通过Twitter API...
    packageimg
  • 科学代理基准测试数据集-多学科任务评估-henryshan

    2025年4月21日   

    科学代理基准测试数据集-多学科任务评估-henryshan 数据来源:互联网公开数据 标签:科学代理,语言模型,自动化,科学发现,基准测试,数据驱动,评估,Python程序,多学科 数据概述:...
    packageimg
  • 跨语言问答数据集XQuAD多语言问答数据集-thedevastator

    2025年4月21日   

    跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:...
    packageimg
  • 俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor

    2025年4月21日   

    俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor 数据来源:互联网公开数据 标签:俄罗斯诗歌,文学,灵感,文化,语言模型, seq2seq,文本生成 数据概述:...
    packageimg
  • 印度维基百科文章数据集

    2025年4月20日   

    印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas...
    packageimg
  • 多语言命名实体识别数据集

    2025年4月19日   

    多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:...
    packageimg
  • 对话与文学风格文本数据集

    2025年4月18日   

    对话与文学风格文本数据集 数据来源:互联网公开数据 标签:对话风格,文学风格,文本风格转换,俄语数据,自然语言处理,机器学习,语言模型 数据概述:...
    packageimg
  • 伦巴第语命名实体识别与语言训练数据集

    2025年4月17日   

    伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...
    packageimg