找到5,810个数据集

标签: 文本分析

过滤结果
  • 数据2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider

    2025年4月24日   

    2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,自然语言处理,电影研究,情感分析,社交媒体,用户评价 数据概述:该数据集包含来自互联网公开渠道的2023年电影评论数据,记录了多部电影的观众评论及评分。主要特征如下:...
    packageimg
  • 毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis

    2025年4月24日   

    毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis 数据来源:互联网公开数据 标签:毒性评论,数据集,自然语言处理,机器学习,文本分析,社会研究,伦理学,人工智能 数据概述:该数据集包含了来自Jigsaw平台的评论数据,记录了评论的毒性及其相关属性。主要特征如下:...
    packageimg
  • 英语古兰经EnglishQuranDataset-esraaaabdelrazek

    2025年4月24日   

    英语古兰经EnglishQuranDataset-esraaaabdelrazek 数据来源:互联网公开数据 标签:古兰经,数据集,宗教,伊斯兰教,翻译,文本分析,语言学,学术研究 数据概述: 该数据集包含英语翻译的《古兰经》,记录了古兰经的文本内容及其相关注释。主要特征如下: 时间跨度:数据记录的时间范围从现代翻译版本开始。...
    packageimg
  • Reddit社区仇恨言论检测数据集-devanshivipul

    2025年4月24日   

    Reddit社区仇恨言论检测数据集-devanshivipul 数据来源:互联网公开数据 标签:社交媒体,仇恨言论,文本分析,自然语言处理,机器学习,情感分析,言论审查,数据集 数据概述: 该数据集包含来自Reddit社区的评论数据,用于仇恨言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不详,但覆盖了Reddit社区的长期活跃时期。...
    packageimg
  • 自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya

    2025年4月24日   

    自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源:互联网公开数据 标签:自然语言处理,信息检索,数据集,文本分类,机器学习,深度学习,文本分析,数据挖掘 数据概述:...
    packageimg
  • Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong

    2025年4月24日   

    Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong 数据来源:互联网公开数据 标签:Airbnb, 数据集, 词频统计, 自然语言处理, 旅游, 房源描述, 机器学习, 文本分析 数据概述:该数据集包含来自Airbnb的房源描述文本数据,记录了房源描述的词频统计信息。主要特征如下:...
    packageimg
  • 英文文本序列长度验证数据集SequenceLength128-bamps53

    2025年4月24日   

    英文文本序列长度验证数据集SequenceLength128-bamps53 数据来源:互联网公开数据 标签:自然语言处理,文本处理,序列建模,数据集,机器学习,文本验证,文本分析,深度学习 数据概述: 该数据集包含经过处理的英文文本数据,主要用于验证和测试自然语言处理模型,特别是针对序列长度为128的文本序列。主要特征如下:...
    packageimg
  • 维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj

    2025年4月24日   

    维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:...
    packageimg
  • 元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy

    2025年4月24日   

    元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy 数据来源:互联网公开数据 标签:文学,数据集,元数据,图书信息,数字图书馆,文本分析,学术研究,机器学习 数据概述: 该数据集包含来自古腾堡计划(Gutenberg Project)的图书元数据,记录了该计划收录的各类图书的详细信息。主要特征如下:...
    packageimg
  • 医疗问答数据集QA-MED-nguynvtng

    2025年4月24日   

    医疗问答数据集QA-MED-nguynvtng 数据来源:互联网公开数据 标签:医疗,问答,数据集,自然语言处理,医学,机器学习,文本分析,知识图谱 数据概述: 该数据集包含医疗领域的问答对,旨在促进医疗领域的自然语言处理研究。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的医疗知识。 地理范围:...
    packageimg
  • 安卓应用分析与用户评论数据集-kakamana

    2025年4月24日   

    安卓应用分析与用户评论数据集-kakamana 数据来源:互联网公开数据 标签:安卓应用,用户评论,情感分析,自然语言处理,移动应用,应用商店,数据挖掘,文本分析 数据概述: 该数据集包含安卓应用相关信息以及用户评论数据,用于分析用户对应用的评价和使用情况。主要特征如下: 时间跨度:数据记录的时间范围为应用发布至今。...
    packageimg
  • 命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1

    2025年4月24日   

    命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,深度学习,人工智能 数据概述: 该数据集包含标注好的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:...
    packageimg
  • 简历数据库CVDatabase数据分析数据集-anissamylaamri

    2025年4月24日   

    简历数据库CVDatabase数据分析数据集-anissamylaamri 数据来源:互联网公开数据 标签:简历,数据库,人才,招聘,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自简历数据库的数据,记录了求职者的个人信息,教育背景,工作经历,技能特长等。主要特征如下:...
    packageimg
  • 坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210

    2025年4月24日   

    坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210 数据来源:互联网公开数据 标签:音乐,歌词,坏兔子,西班牙语,数据集,文本分析,自然语言处理,文化研究 数据概述: 该数据集包含了坏兔子(Bad Bunny)的歌曲歌词数据,记录了他在2022年1月30日之前的歌曲的歌词信息。主要特征如下:...
    packageimg
  • 焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein

    2025年4月24日   

    焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein 数据来源:互联网公开数据 标签:焦虑情绪,社交媒体,数据集,自然语言处理,心理健康,情感分析,机器学习,文本分析...
    packageimg
  • 印尼传统诗歌Pantun数据集-husnifadhilah

    2025年4月24日   

    印尼传统诗歌Pantun数据集-husnifadhilah 数据来源:互联网公开数据 标签:诗歌,文学,数据集,印尼文化,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含了印度尼西亚的传统诗歌(Pantun)文本数据,记录了大量的Pantun诗句,是研究印尼传统文化和文学的重要资源。主要特征如下: 时间跨度:...
    packageimg
  • 越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai

    2025年4月24日   

    越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:...
    packageimg
  • 高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai

    2025年4月24日   

    高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:...
    packageimg
  • 新闻头条数据集NewsHeadlineDataset-satyamneelmani

    2025年4月24日   

    新闻头条数据集NewsHeadlineDataset-satyamneelmani 数据来源:互联网公开数据 标签:新闻,头条,数据集,文本分析,自然语言处理,机器学习,信息检索,舆情分析 数据概述:该数据集包含来自各大新闻媒体的头条新闻数据,记录了新闻的标题,发布时间,来源媒体,新闻类别等信息。主要特征如下:...
    packageimg
  • 大型情绪数据集LargeEmotionDataset-ubbarapusiri

    2025年4月24日   

    大型情绪数据集LargeEmotionDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,心理学,文本分析,人工智能 数据概述: 该数据集包含了来自多个来源的情绪标注文本数据,适用于情绪识别和情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg