数据集 - 海数据

生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko

2025年4月23日

生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源：互联网公开数据标签：自然语言处理，实体识别，数据集，机器学习，文本分析，地理信息，人工智能，语义理解数据概述：该数据集包含通过生成式模型创建的文本数据，专注于山脉相关实体的识别任务。主要特征如下：...

ZIP

报告使用文件数据集-justingrima

2025年4月23日

报告使用文件数据集-justingrima 数据来源：互联网公开数据标签：报告，文件，数据集，数据分析，文本挖掘，自然语言处理，信息检索，文档管理数据概述：该数据集包含了用于报告的文件数据，记录了报告中涉及的各种文件信息。主要特征如下：时间跨度：数据记录的时间范围跨度不确定，取决于报告所涵盖的时间段。...

ZIP

突尼斯阿拉伯语方言情感分析训练数据集-2023-kingabzpro

2025年4月23日

突尼斯阿拉伯语方言情感分析训练数据集-2023-kingabzpro 数据来源：互联网公开数据标签：阿拉伯语,方言,情感分析,突尼斯,机器学习,自然语言处理,社交媒体,训练数据数据概述：...

ZIP

情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni

2025年4月23日

情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni 数据来源：互联网公开数据标签：情感分析，情感识别，数据集，自然语言处理，机器学习，文本分类，情感计算，数据挖掘数据概述：该数据集包含来自FEEL-IT项目的初步研究结果，记录了文本数据的情感识别信息。主要特征如下：...

ZIP

专利摘要分析数据集PatentsAbstractsDataset-chizzi25

2025年4月23日

专利摘要分析数据集PatentsAbstractsDataset-chizzi25 数据来源：互联网公开数据标签：专利，摘要，文本分析，自然语言处理，机器学习，专利检索，知识产权，技术创新数据概述：该数据集包含来自公开专利文献的摘要信息，记录了不同领域的专利技术描述。主要特征如下：...

ZIP

优步用户评论数据集UberUserReviewsDataset-smaranikasikdar

2025年4月23日

优步用户评论数据集UberUserReviewsDataset-smaranikasikdar 数据来源：互联网公开数据标签：优步，用户评论，情感分析，自然语言处理，数据集，文本挖掘，服务评价，出行数据概述：该数据集包含来自优步（Uber）用户的评论数据，记录了用户对优步服务的反馈和评价。主要特征如下：...

ZIP

威尼斯商人角色问答聊天机器人评估数据集VeneziaMerchantCharacterQ-AChatbotEvaluationDataset-shresh...

2025年4月23日

威尼斯商人角色问答聊天机器人评估数据集VeneziaMerchantCharacterQ-AChatbotEvaluationDataset-shreshthabhowmik12 数据来源：互联网公开数据标签：聊天机器人，问答系统，角色评估，自然语言处理，数据集，评估指标，对话系统，人工智能...

ZIP

虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin

2025年4月23日

虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin 数据来源：互联网公开数据标签：虚假新闻，假新闻检测，文本分析，自然语言处理，机器学习，新闻分类，信息真实性，数据挖掘数据概述：该数据集包含经过处理的虚假新闻数据，旨在用于虚假新闻的检测和分类。主要特征如下：...

ZIP

伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524

2025年4月23日

伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524 数据来源：互联网公开数据标签：伊斯兰教，书籍，文本分析，宗教研究，自然语言处理，数据集，文化，文献数据概述：该数据集包含来自互联网的1000本伊斯兰书籍的文本数据，涵盖了伊斯兰教的各个方面。主要特征如下：...

ZIP

数据2024年Reddit帖子数据集-vooono

2025年4月23日

2024年Reddit帖子数据集-vooono 数据来源：互联网公开数据标签：社交媒体，Reddit，帖子，文本分析，情感分析，自然语言处理，数据挖掘，用户行为数据概述：该数据集包含来自Reddit平台的帖子数据，记录了用户在不同版块发布的文本内容及相关信息。主要特征如下：时间跨度：数据记录的时间范围为2024年。...

ZIP

反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid

2025年4月23日

反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid 数据来源：互联网公开数据标签：垃圾邮件，数据集，文本分析，自然语言处理，机器学习，分类算法，数据预处理，文本挖掘数据概述：该数据集包含经过预处理的反垃圾邮件数据，用于垃圾邮件检测和分类任务。主要特征如下：时间跨度：...

ZIP

土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin

2025年4月23日

土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin 数据来源：互联网公开数据标签：土耳其，科技新闻，自然语言处理，文本分析，新闻摘要，情感分析，机器学习，土耳其语数据概述：该数据集包含来自土耳其新闻网站的科技新闻文章，记录了土耳其科技领域的新闻报道。主要特征如下：...

ZIP

课程评论数据集ReviewsCourseDataset-anjaneyagupta03

2025年4月23日

课程评论数据集ReviewsCourseDataset-anjaneyagupta03 数据来源：互联网公开数据标签：课程评论，数据集，自然语言处理，情感分析，文本挖掘，教育，机器学习，评价数据概述：该数据集包含来自在线课程的评论数据，记录了学生对课程的评价和反馈。主要特征如下：时间跨度：数据记录的时间范围未知，但通常涵盖课程的多个学期或年份。...

ZIP

生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555

2025年4月23日

生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源：互联网公开数据标签：生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学数据概述：...

ZIP

比利时法语法律问答与法规检索数据集-thedevastator

2025年4月23日

比利时法语法律问答与法规检索数据集-thedevastator 数据来源：互联网公开数据标签：法律,比利时,法规,问答,检索,自然语言处理,机器学习,法律科技数据概述：...

ZIP

维基百科平衡性别共指数据集-thedevastator

2025年4月23日

维基百科平衡性别共指数据集-thedevastator 数据来源：互联网公开数据标签：共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究数据概述：...

ZIP

自然语言处理项目原始数据集-emilygreen8

2025年4月23日

自然语言处理项目原始数据集-emilygreen8 数据来源：互联网公开数据标签：自然语言处理，NLP，数据集，文本数据，语料库，数据预处理，机器学习，文本分析数据概述：该数据集包含用于自然语言处理（NLP）项目的原始文本数据，涵盖多种文本来源和语言。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于各个子数据集的发布时间。...

ZIP

问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82

2025年4月23日

问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源：互联网公开数据标签：问答系统，数据集，自然语言处理，机器学习，语义理解，信息检索，知识图谱，人工智能数据概述：该数据集包含来自tgif问答系统项目的大量问答对数据，记录了用户提问与系统回答的详细信息。主要特征如下：...

ZIP

推特情感分析增强数据集-推文情感与文本增强-mks2192

2025年4月23日

推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源：互联网公开数据标签：推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据数据概述：...

ZIP

跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

2025年4月23日

跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源：互联网公开数据标签：自然语言处理，文本数据，数据集，跨编码器，语义理解，机器学习，深度学习，文本匹配数据概述：该数据集包含用于训练跨编码器模型的大量文本数据，旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下：...

ZIP

找到11,786个数据集

注册成功！