找到11,858个数据集

标签: 自然语言处理

过滤结果
  • IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12

    2025年4月25日   

    IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,情感计算,大数据 数据概述:...
    packageimg
  • 情感分析方面提取数据集ABS-A-AspectDataset-darrellcr

    2025年4月25日   

    情感分析方面提取数据集ABS-A-AspectDataset-darrellcr 数据来源:互联网公开数据 标签:情感分析,方面提取,数据集,自然语言处理,机器学习,文本挖掘,数据标注,人工智能 数据概述: 该数据集专注于情感分析和方面提取任务,记录了包含多个方面的文本数据及相应的情感标签。主要特征如下:...
    packageimg
  • 通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi

    2025年4月25日   

    通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:...
    packageimg
  • 主题模型分析数据集LDADataset-raditsoic

    2025年4月25日   

    主题模型分析数据集LDADataset-raditsoic 数据来源:互联网公开数据 标签:主题模型,LDA,文本分析,自然语言处理,数据集,机器学习,文档分析,数据挖掘 数据概述: 该数据集包含用于主题模型分析的文本数据,旨在探索和发现文本集合中隐藏的主题结构。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体文本内容的时间属性。...
    packageimg
  • 地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe

    2025年4月25日   

    地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe 数据来源:互联网公开数据 标签:推文,数据集,地点提取,自然语言处理,地理信息,社交媒体,文本分析,大数据 数据概述: 该数据集包含来自社交媒体平台的推文数据,主要用于地点信息的提取和分析。主要特征如下:...
    packageimg
  • 跨领域开放域问答数据集COSMOSQADataset-sidop21

    2025年4月25日   

    跨领域开放域问答数据集COSMOSQADataset-sidop21 数据来源:互联网公开数据 标签:开放域问答,自然语言处理,数据集,机器学习,对话系统,信息检索,文本理解,知识图谱 数据概述: 该数据集包含来自COSMOS项目的开放域问答数据,记录了用户提出的各种问题及其对应的答案。主要特征如下:...
    packageimg
  • Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso

    2025年4月25日   

    Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso 数据来源:互联网公开数据 标签:问答平台,用户收入,数据集,机器学习,自然语言处理,文本分析,社交媒体,收入预测 数据概述:...
    packageimg
  • 情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21

    2025年4月25日   

    情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21 数据来源:互联网公开数据 标签:情感分析,文本数据,自然语言处理,数据集,情感分类,机器学习,数据清洗,中文文本 数据概述: 该数据集包含经过清洗的中文情感分析数据,主要用于情感分类,文本挖掘等任务。主要特征如下: 时间跨度:...
    packageimg
  • 阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki

    2025年4月25日   

    阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:...
    packageimg
  • 域名有效性预测数据集-harjotsaini2

    2025年4月25日   

    域名有效性预测数据集-harjotsaini2 数据来源:互联网公开数据 标签:域名,有效性,预测,机器学习,网络安全,数据分析,自然语言处理,风险评估 数据概述: 该数据集包含用于预测域名有效性的相关数据,记录了域名注册信息,域名历史数据,以及相关网站的特征。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据的更新频率,通常涵盖数年。...
    packageimg
  • 技能映射数据集SkillMappingDataset-cyanblot

    2025年4月25日   

    技能映射数据集SkillMappingDataset-cyanblot 数据来源:互联网公开数据 标签:技能,映射,数据集,知识图谱,自然语言处理,机器学习,职业发展,人才管理 数据概述: 该数据集包含有关技能与职业之间关系的数据,旨在帮助用户理解和分析不同技能在各种职业中的应用。主要特征如下:...
    packageimg
  • 文本生成预测数据集NextWordGenerateDataset-anirudhasutar

    2025年4月25日   

    文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:...
    packageimg
  • 总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan

    2025年4月25日   

    总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan 数据来源:互联网公开数据 标签:政治,演讲,文本分析,自然语言处理,机器学习,数据挖掘,公共管理,社会科学 数据概述: 该数据集包含来自多个国家总统的演讲文本数据,记录了不同时期,不同场合的演讲内容。主要特征如下:...
    packageimg
  • 阿拉伯语新闻分类数据集-essasartawi

    2025年4月25日   

    阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 图卢维基百科数据转储2023年数据集-moreducks

    2025年4月25日   

    图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...
    packageimg
  • 恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio

    2025年4月25日   

    恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio 数据来源:互联网公开数据 标签:文本分类,作者识别,数据集,机器学习,自然语言处理,文学分析,数据挖掘,人工智能 数据概述: 该数据集包含来自三位恐怖小说作家的文本数据,主要用于作者身份识别和文本分类任务。主要特征如下:...
    packageimg
  • 美国经济新闻数据集UnitedStatesEconomicNewsDataset-mohamedmustafashaban

    2025年4月25日   

    美国经济新闻数据集UnitedStatesEconomicNewsDataset-mohamedmustafashaban 数据来源:互联网公开数据 标签:经济新闻,数据集,新闻分析,时间序列,机器学习,自然语言处理,财经研究,商业智能 数据概述:...
    packageimg
  • 恶意软件一元词数据集Malware1-gramSampleDataset-syira19

    2025年4月25日   

    恶意软件一元词数据集Malware1-gramSampleDataset-syira19 数据来源:互联网公开数据 标签:恶意软件,数据集,一元词,文本分析,机器学习,安全研究,恶意代码检测,自然语言处理 数据概述: 该数据集包含恶意软件样本的一元词数据,用于恶意软件检测和分析。主要特征如下:...
    packageimg
  • 企业财报电话会议元数据数据集EarningsCallsCleanedMetadataDataset-ashwinm500

    2025年4月25日   

    企业财报电话会议元数据数据集EarningsCallsCleanedMetadataDataset-ashwinm500 数据来源:互联网公开数据 标签:企业财报,电话会议,元数据,数据分析,商业智能,自然语言处理,金融分析,数据挖掘 数据概述: 该数据集包含来自各类企业的财报电话会议的元数据,记录了电话会议的关键信息。主要特征如下:...
    packageimg
  • 文本摘要任务数据集FinalTextSummarizationDataset-devtousif

    2025年4月25日   

    文本摘要任务数据集FinalTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,机器翻译,文本分析,人工智能,NLP 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在评估和训练文本摘要模型。主要特征如下:...
    packageimg