找到11,864个数据集

标签: 自然语言处理

过滤结果
  • Statement1文件数据集-morizin

    2025年4月25日   

    Statement1文件数据集-morizin 数据来源:互联网公开数据 标签:财务报表,数据集,文本分析,自然语言处理,会计学,金融,机器学习,文本挖掘 数据概述:该数据集包含来自Statement1 文件的财务报表数据,记录了公司的财务状况和业绩表现。主要特征如下: 时间跨度:数据记录的时间范围涵盖多个年度。 地理范围:数据来源于全球范围内的公司。...
    packageimg
  • Netflix内容分析及自然语言处理数据集NetflixDataVisualizationandNLPDataset-esrabicakci

    2025年4月25日   

    Netflix内容分析及自然语言处理数据集NetflixDataVisualizationandNLPDataset-esrabicakci 数据来源:互联网公开数据 标签:流媒体,内容分析,自然语言处理,数据可视化,机器学习,文本挖掘,影视分析,数据科学 数据概述:...
    packageimg
  • 阿尔及利亚阿拉伯语方言词汇数据集-fouadtomy

    2025年4月25日   

    阿尔及利亚阿拉伯语方言词汇数据集-fouadtomy 数据来源:互联网公开数据 标签:阿尔及利亚,阿拉伯语,方言,词汇,语言学,文化研究,数据集,自然语言处理 数据概述: 该数据集包含了阿尔及利亚阿拉伯语方言中的词汇。主要特征如下: 时间跨度:数据记录的时间范围主要集中在现代。 地理范围:数据主要覆盖阿尔及利亚地区。...
    packageimg
  • Mistral-7B生成文本数据集-thienanlnguyen

    2025年4月25日   

    Mistral-7B生成文本数据集-thienanlnguyen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,语言模型,生成式AI,文本分析,人工智能 数据概述: 该数据集包含由 Mistral-7B 语言模型生成的文本数据,用于研究和评估模型的文本生成能力。主要特征如下: 时间跨度:数据生成时间为近期。...
    packageimg
  • 双向长短期记忆网络分类数据集Bi-LSTM0-969ClassificationDataset-mirenaborisova

    2025年4月25日   

    双向长短期记忆网络分类数据集Bi-LSTM0-969ClassificationDataset-mirenaborisova 数据来源:互联网公开数据 标签:深度学习,神经网络,数据集,分类任务,时间序列,自然语言处理,机器学习,序列建模 数据概述: 该数据集专注于双向长短期记忆网络(Bi-LSTM)在分类任务中的应用,记录了用于训练和评估Bi-...
    packageimg
  • 短信分类数据集SMSClassifierDataset-prasaddablikar

    2025年4月25日   

    短信分类数据集SMSClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:短信分类,数据集,文本分析,机器学习,自然语言处理,分类算法,通信技术,数据挖掘 数据概述: 该数据集包含来自通信运营商的短信数据,记录了各类短信的文本内容和分类标签。主要特征如下:...
    packageimg
  • 观点分类训练数据集OpinionClassifierTrainingData-mkearney

    2025年4月25日   

    观点分类训练数据集OpinionClassifierTrainingData-mkearney 数据来源:互联网公开数据 标签:自然语言处理,文本分类,情感分析,机器学习,数据集,观点挖掘,计算机科学,人工智能 数据概述: 该数据集包含用于训练观点分类模型的文本数据,记录了各种来源的观点性文本及其分类标签。主要特征如下:...
    packageimg
  • Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544

    2025年4月25日   

    Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544 数据来源:互联网公开数据 标签:笑话,数据集,社交媒体,文本分析,自然语言处理,情感分析,娱乐内容,数据分析 数据概述: 该数据集包含来自Reddit平台的清洁笑话数据,记录了用户发布的无冒犯内容的笑话。主要特征如下:...
    packageimg
  • 医学评论文本情感分析数据集-deepalighodki

    2025年4月25日   

    医学评论文本情感分析数据集-deepalighodki 数据来源:互联网公开数据 标签:医学,评论,情感分析,文本挖掘,自然语言处理,医疗健康,机器学习,NLP 数据概述: 该数据集包含了来自互联网的医学评论文本数据,主要记录了患者对医疗服务,药物疗效,医生评价等方面的反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于评论的发布时间。...
    packageimg
  • 城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema

    2025年4月25日   

    城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban...
    packageimg
  • 书籍推荐数据集BXBookDataset-alizaynoor

    2025年4月25日   

    书籍推荐数据集BXBookDataset-alizaynoor 数据来源:互联网公开数据 标签:书籍,图书,推荐系统,数据集,用户行为,文本分析,自然语言处理,机器学习 数据概述: 该数据集包含来自BX Book数据集的书籍和用户行为数据,记录了用户的书籍阅读和评分信息。主要特征如下: 时间跨度:数据记录的时间范围为2002年之前。...
    packageimg
  • 新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat

    2025年4月25日   

    新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat 数据来源:互联网公开数据 标签:新闻分析,标签生成,数据集,自然语言处理,文本挖掘,机器学习,新闻分类,人工智能 数据概述:...
    packageimg
  • 电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-chalikamihiran

    2025年4月25日   

    电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-chalikamihiran 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本挖掘,机器学习,数据科学,情感分类 数据概述:该数据集包含来自互联网的电影评论数据,记录了用户对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • 伊朗波斯语文本数据集PersianDatasetIR-amirali10281

    2025年4月25日   

    伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:...
    packageimg
  • COVID-19论文摘要标注数据集COVID-19AnnotatedAbstractsDataset-qingxiangyan

    2025年4月25日   

    COVID-19论文摘要标注数据集COVID-19AnnotatedAbstractsDataset-qingxiangyan 数据来源:互联网公开数据 标签:COVID-19,医学研究,论文摘要,数据集,文本标注,自然语言处理,机器学习,公共卫生 数据概述:...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewDataset-davidlow

    2025年4月25日   

    亚马逊商品评论数据集AmazonProductReviewDataset-davidlow 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,自然语言处理,情感分析,机器学习,消费者行为,数据挖掘 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价信息。主要特征如下:...
    packageimg
  • 代码审查文件数据集OutputChecksFilesDataset-robinlord

    2025年4月25日   

    代码审查文件数据集OutputChecksFilesDataset-robinlord 数据来源:互联网公开数据 标签:代码审查,代码质量,数据集,软件工程,机器学习,自然语言处理,文本分析,代码分析 数据概述: 该数据集包含了代码审查过程中产生的各种输出文件,主要用于分析代码质量,发现潜在缺陷以及评估代码审查的效果。主要特征如下:...
    packageimg
  • Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa

    2025年4月25日   

    Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,评论,毒性检测,情感分析,机器学习,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,包含了来自不同在线平台的评论数据,旨在用于毒性检测和情感分析等自然语言处理任务。主要特征如下:...
    packageimg
  • 保罗-科埃略炼金术士小说文本数据集-stealthtechnologies

    2025年4月25日   

    保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。...
    packageimg
  • CCF金融文本情感分析数据集-danielfme

    2025年4月25日   

    CCF金融文本情感分析数据集-danielfme 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,自然语言处理,机器学习,数据集,中文,金融科技 数据概述: 该数据集包含来自CCF(中国计算机学会)金融领域的文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但主要反映金融领域相关的文本信息。...
    packageimg