找到11,786个数据集

标签: 自然语言处理

过滤结果
  • 聊天用语数据集ChatSlangDataset-muhammadbilal6305

    2025年4月23日   

    聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源:互联网公开数据 标签:聊天用语,社交媒体,数据集,自然语言处理,机器学习,文本分析,语言学,沟通研究 数据概述:该数据集包含来自社交媒体平台的聊天用语数据,记录了人们在聊天中使用的非正式语言,缩写和俚语。主要特征如下:...
    packageimg
  • 数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich

    2025年4月23日   

    数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich 数据来源:互联网公开数据 标签:数据科学,文章元数据,数据集,内容分析,机器学习,自然语言处理,出版分析,教育研究 数据概述: 该数据集包含来自数据科学方向(Towards Data...
    packageimg
  • 维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez

    2025年4月23日   

    维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,信息检索,机器学习,电影研究 数据概述: 该数据集包含来自维基百科的电影剧情摘要数据,记录了大量电影的剧情概要信息。主要特征如下:...
    packageimg
  • 罗马乌尔都语文本数据集-akarami

    2025年4月23日   

    罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。...
    packageimg
  • 英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar

    2025年4月23日   

    英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:...
    packageimg
  • BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci

    2025年4月23日   

    BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,词云,文本分析,信息提取,新闻研究,学术资源...
    packageimg
  • 神经信息处理系统会议1987至2015年词频上下文数据集-saurabhbhagvatula

    2025年4月23日   

    神经信息处理系统会议1987至2015年词频上下文数据集-saurabhbhagvatula 数据来源:互联网公开数据 标签:NIPS,会议论文,词频,自然语言处理,学术研究,计算机科学,数据科学,词频分析,上下文分析 数据概述: 本数据集来源于神经信息处理系统会议(NIPS, Conference on Neural Information...
    packageimg
  • 太阳能行业评论情感分析数据集SolarComments200Dataset-mohsin272

    2025年4月23日   

    太阳能行业评论情感分析数据集SolarComments200Dataset-mohsin272 数据来源:互联网公开数据 标签:太阳能,评论分析,情感分析,数据集,自然语言处理,文本挖掘,机器学习,行业分析 数据概述: 该数据集包含了来自互联网的关于太阳能行业的评论数据,旨在用于情感分析和文本挖掘研究。主要特征如下:...
    packageimg
  • Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa

    2025年4月23日   

    Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa 数据来源:互联网公开数据 标签:图像描述,数据集,自然语言处理,计算机视觉,机器学习,文本生成,数据增强,人工智能 数据概述:...
    packageimg
  • 黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung

    2025年4月23日   

    黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本分析,信息提取,人工智能,数据挖掘 数据概述: 该数据集包含来自多个来源的文本摘要数据,记录了原始文本及其对应的摘要信息。主要特征如下:...
    packageimg
  • 美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo

    2025年4月23日   

    美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo 数据来源:互联网公开数据 标签:政治,演讲,历史,文本分析,自然语言处理,语料库,美国,公开演讲 数据概述: 该数据集包含了来自美国总统的演讲内容,记录了历任美国总统在不同场合发表的演讲全文。主要特征如下:...
    packageimg
  • Reddit社区情感分析数据集-vijayj0shi

    2025年4月23日   

    Reddit社区情感分析数据集-vijayj0shi 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本挖掘,自然语言处理,机器学习,Reddit,情绪识别,舆情分析 数据概述:该数据集包含了从Reddit社区抓取的帖子和评论数据,用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围根据数据集内容而定。...
    packageimg
  • 中文文本词频数据集TF-Word-FrequencyDataset-ludwing129

    2025年4月23日   

    中文文本词频数据集TF-Word-FrequencyDataset-ludwing129 数据来源:互联网公开数据 标签:文本分析,词频统计,数据集,自然语言处理,语言学,机器学习,文本挖掘,中文处理 数据概述: 该数据集包含来自多个中文文本源的词频统计信息,记录了常见中文词汇在不同文本中的出现频率。主要特征如下:...
    packageimg
  • 办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98

    2025年4月23日   

    办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98 数据来源:互联网公开数据 标签:办公场景,对话脚本,数据集,自然语言处理,文本分析,情感分析,机器学习,语料库 数据概述: 该数据集包含来自美剧《办公室》(The Office)的对话脚本数据,记录了剧中角色在工作场景中的对话内容。主要特征如下:...
    packageimg
  • AirIndiaTripadvisor旅客评价数据集2023-kanchana1990

    2025年4月23日   

    AirIndiaTripadvisor旅客评价数据集2023-kanchana1990 数据来源:互联网公开数据 标签:Air India,旅客评价,旅游,航空,客户满意度,自然语言处理,情感分析,客户服务 数据概述: 本数据集“Air India TripAdvisor旅客评价”收录了游客对Air...
    packageimg
  • 股票新闻情感分析数据集StockNewsSentimentAnalysisDataset-eshanrizz

    2025年4月23日   

    股票新闻情感分析数据集StockNewsSentimentAnalysisDataset-eshanrizz 数据来源:互联网公开数据 标签:股票,新闻,情感分析,自然语言处理,数据集,金融,机器学习,文本分析 数据概述: 该数据集包含来自多个新闻网站和财经媒体的股票新闻数据,用于情感分析和量化交易研究。主要特征如下:...
    packageimg
  • 推特情绪分析数据集Topic-SentimentDataset-yojn710

    2025年4月23日   

    推特情绪分析数据集Topic-SentimentDataset-yojn710 数据来源:互联网公开数据 标签:情感分析,推特,数据集,自然语言处理,文本挖掘,机器学习,舆情分析,社交媒体 数据概述: 该数据集包含来自推特平台的大量推文数据,并标注了相应的情感极性。主要特征如下: 时间跨度:数据记录的时间范围从未知,取决于数据集的具体版本。...
    packageimg
  • 印度尼西亚评论情感分析训练数据集2023

    2025年4月23日   

    印度尼西亚评论情感分析训练数据集2023 数据来源:互联网公开数据 标签:评论分析,情感分类,毒评检测,训练数据,机器学习,自然语言处理 数据概述:...
    packageimg
  • 英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69

    2025年4月23日   

    英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:...
    packageimg
  • 相机产品评价数据集CameraProductReviewsDataset-taqiyyaghazi

    2025年4月23日   

    相机产品评价数据集CameraProductReviewsDataset-taqiyyaghazi 数据来源:互联网公开数据 标签:相机产品,用户评价,数据集,产品分析,自然语言处理,消费者行为,电子商务,市场研究 数据概述:该数据集包含了来自多个电商平台的相机产品用户评价数据,记录了用户对相机产品的使用体验和反馈。主要特征如下:...
    packageimg