-
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
Spacy测试数据集SpacyTestDataset-hhhurenyuan
Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。... -
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:... -
大型语言模型偏见与真实性评估数据集-pallaviroyal
大型语言模型偏见与真实性评估数据集-pallaviroyal 数据来源:互联网公开数据 标签:语言模型,偏见,真实性,评估,自然语言处理,机器学习,CrowS-Pairs,WinoGender,TruthfulQA 数据概述:... -
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本分析,机器学习,语言模型,数据集,文本分类,机器翻译 数据概述: 该数据集包含来自孟加拉语的段落文本数据,记录了孟加拉语的段落内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。... -
全球GPT-1N外部模型评估数据集-sasrdw
全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。... -
对话摘要数据集SAMSUM-jainikkhil
对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。... -
提示生成数据集PromptsGeneratedV2Dataset-andreivanenko
提示生成数据集PromptsGeneratedV2Dataset-andreivanenko 数据来源:互联网公开数据 标签:自然语言处理,提示生成,数据集,机器学习,文本生成,人工智能,语言模型,数据科学 数据概述: 该数据集包含来自Prompts Generated V2项目的提示生成数据,记录了用于训练和评估语言模型的提示文本。主要特征如下:... -
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:... -
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,模型训练,BART,文本匹配,语言模型,人工智能 数据概述: 该数据集包含杰布·普罗姆特(JB... -
文本可读性分析演示数据集-uocoeeds
文本可读性分析演示数据集-uocoeeds 数据来源:互联网公开数据 标签:文本分析,可读性,自然语言处理,数据集,语言模型,文本挖掘,机器学习,教育 数据概述: 该数据集包含来自不同来源的文本数据,旨在用于评估和演示文本可读性分析方法。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的文本。... -
金融推文数据集-2021至2023年-amulyas
金融推文数据集-2021至2023年-amulyas 数据来源:互联网公开数据 标签:金融推文,社交媒体,金融影响者,情感分析,语言模型,比特币,股票,市场趋势 数据概述:... -
ChatGPT推特首月数据集2022年11月至12月-pcminh0505
ChatGPT推特首月数据集2022年11月至12月-pcminh0505 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,人工智能,语言模型,科研,学术研究 数据概述: 本数据集包含了2022年11月30日至2022年12月31日期间,所有与ChatGPT相关的推特信息。数据通过Twitter API... -
科学代理基准测试数据集-多学科任务评估-henryshan
科学代理基准测试数据集-多学科任务评估-henryshan 数据来源:互联网公开数据 标签:科学代理,语言模型,自动化,科学发现,基准测试,数据驱动,评估,Python程序,多学科 数据概述:... -
跨语言问答数据集XQuAD多语言问答数据集-thedevastator
跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:... -
俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor
俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor 数据来源:互联网公开数据 标签:俄罗斯诗歌,文学,灵感,文化,语言模型, seq2seq,文本生成 数据概述:... -
印度维基百科文章数据集
印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas... -
多语言命名实体识别数据集
多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:... -
对话与文学风格文本数据集
对话与文学风格文本数据集 数据来源:互联网公开数据 标签:对话风格,文学风格,文本风格转换,俄语数据,自然语言处理,机器学习,语言模型 数据概述:... -
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...