找到5,805个数据集

标签: 文本分析

过滤结果
  • 问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20

    2025年4月22日   

    问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,知识图谱,信息检索,人工智能 数据概述: 该数据集包含来自互联网的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • 新闻标题预测数据集HeadlinePredictionDataset-bohraboxer

    2025年4月22日   

    新闻标题预测数据集HeadlinePredictionDataset-bohraboxer 数据来源:互联网公开数据 标签:新闻媒体,文本分析,数据集,机器学习,自然语言处理,预测模型,信息提取,深度学习 数据概述: 该数据集记录了来自新闻媒体平台的新闻标题及相关文本数据,主要包含新闻标题,正文片段,发布时间等特征。主要特征如下:...
    packageimg
  • 雅思备考学习包数据集IELTSPackageDataset-tharakinfinity

    2025年4月22日   

    雅思备考学习包数据集IELTSPackageDataset-tharakinfinity 数据来源:互联网公开数据 标签:雅思,备考,数据集,语言学习,英语,考试,文本分析,自然语言处理 数据概述: 该数据集包含雅思考试相关的学习资料,旨在为备考雅思的考生提供全面的学习资源。主要特征如下:...
    packageimg
  • 互联网电影数据库IMDB部分电影样本数据集-thinkerston

    2025年4月22日   

    互联网电影数据库IMDB部分电影样本数据集-thinkerston 数据来源:互联网公开数据 标签:电影,影评,数据集,自然语言处理,情感分析,机器学习,文本分析,电影数据 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的部分电影样本数据,主要记录了电影的影评信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年份的电影作品。...
    packageimg
  • 电商搜索结果相关性评估数据集E-commerceSearchResultRelevanceDataset-awsaf49

    2025年4月22日   

    电商搜索结果相关性评估数据集E-commerceSearchResultRelevanceDataset-awsaf49 数据来源:互联网公开数据 标签:电商,搜索,相关性,数据集,机器学习,自然语言处理,文本分析,用户行为,搜索排名 数据概述:...
    packageimg
  • 模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan

    2025年4月22日   

    模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan 数据来源:互联网公开数据 标签:模糊匹配,数据集,基准测试,文本分析,自然语言处理,机器学习,信息检索,数据清洗 数据概述: 该数据集包含来自多个来源的文本数据,用于评估和比较不同模糊匹配算法的性能。主要特征如下:...
    packageimg
  • 乌尔都语数据集UrduDataSet-lucca9211

    2025年4月22日   

    乌尔都语数据集UrduDataSet-lucca9211 数据来源:互联网公开数据 标签:乌尔都语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源,文化研究 数据概述:该数据集包含来自互联网和公开资源的乌尔都语文本数据,记录了乌尔都语的各类文本,适用于自然语言处理,文本分析等任务。主要特征如下:...
    packageimg
  • 网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah

    2025年4月22日   

    网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah 数据来源:互联网公开数据 标签:新闻数据,网页抓取,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述:该数据集包含通过网页抓取技术收集的新闻数据,记录了来自多个新闻网站的新闻文章。主要特征如下:...
    packageimg
  • 英国航空乘客评价数据集BritishAirwaysReviewDataset-oheneberchie

    2025年4月22日   

    英国航空乘客评价数据集BritishAirwaysReviewDataset-oheneberchie 数据来源:互联网公开数据 标签:航空公司,乘客评价,情感分析,数据集,文本分析,自然语言处理,服务质量,用户体验 数据概述: 该数据集包含来自英国航空(British...
    packageimg
  • 社交媒体灾害推文数据集SocialMediaDisasterTweetsDataset-hakim11

    2025年4月22日   

    社交媒体灾害推文数据集SocialMediaDisasterTweetsDataset-hakim11 数据来源:互联网公开数据 标签:社交媒体,灾害响应,数据集,自然语言处理,文本分析,机器学习,危机管理,信息识别 数据概述: 该数据集包含来自社交媒体平台Twitter的推文数据,记录了与灾害事件相关的文本内容。主要特征如下:...
    packageimg
  • 英语模板数据集EnglishTemplatedDataset-rnaveensrinivas

    2025年4月22日   

    英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:...
    packageimg
  • 法语维基百科阅读理解挑战数据集-2023-thedevastator

    2025年4月22日   

    法语维基百科阅读理解挑战数据集-2023-thedevastator 数据来源:互联网公开数据 标签:法语,维基百科,阅读理解,语言学习,教育,数据集,问答,文本分析 数据概述: 本数据集包含3835个关于法语维基百科的文章相关问题,旨在帮助学习者提升法语阅读理解能力。数据集由Huggingface...
    packageimg
  • 最终年度项目FYP论文数据集-ahtishamali05

    2025年4月22日   

    最终年度项目FYP论文数据集-ahtishamali05 数据来源:互联网公开数据 标签:毕业设计,学术论文,自然语言处理,文本分析,机器学习,文本挖掘,文献综述,学术研究 数据概述: 该数据集包含来自最终年度项目(FYP)的论文,记录了学生在不同学科领域的研究成果。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 推特文本分析与机器学习数据集TwitterDatasetsforNLPandMachineLearning-aviralmishra1998

    2025年4月22日   

    推特文本分析与机器学习数据集TwitterDatasetsforNLPandMachineLearning-aviralmishra1998 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,自然语言处理,机器学习,情感分析,话题检测,数据集 数据概述:...
    packageimg
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日   

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg
  • 新闻组文本分类数据集20NewsgroupsDataset-aniket13r

    2025年4月22日   

    新闻组文本分类数据集20NewsgroupsDataset-aniket13r 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,新闻,文本分析,主题建模,信息检索 数据概述: 该数据集包含了大约20,000篇新闻组文档,涵盖了20个不同的新闻组主题。主要特征如下: 时间跨度:数据收集的时间范围大约在1990年代初期。...
    packageimg
  • Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra

    2025年4月22日   

    Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra 数据来源:互联网公开数据 标签:情感分析,Netflix,评论,数据集,自然语言处理,文本分析,机器学习,用户行为 数据概述: 该数据集包含来自 Netflix 用户的评论数据,并标注了情感极性。主要特征如下:...
    packageimg
  • 搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024

    2025年4月22日   

    搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:幽默,段子,笑话,数据集,自然语言处理,文本分析,情感分析,娱乐 数据概述: 该数据集包含了来自多个来源的搞笑段子,旨在提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
    packageimg
  • 五三八网站FiveThirtyEight人物角色数据集-saumyatiwari2001

    2025年4月22日   

    五三八网站FiveThirtyEight人物角色数据集-saumyatiwari2001 数据来源:互联网公开数据 标签:人物角色,数据集,电影,电视,媒体,文本分析,数据新闻,流行文化 数据概述: 该数据集收录了来自五三八网站(FiveThirtyEight)的人物角色数据,主要记录了电影和电视节目中人物角色的相关信息。主要特征如下:...
    packageimg
  • 莫里哀戏剧台词数据集-guillaumegrosjean

    2025年4月22日   

    莫里哀戏剧台词数据集-guillaumegrosjean 数据来源:互联网公开数据 标签:戏剧,文学,莫里哀,台词,表演,语言模型,文本分析,法国古典主义,剧本 数据概述: 本数据集收录了莫里哀创作的32部戏剧作品中的所有台词提示(cue)。数据集以.csv文件形式存储,包含6个字段,详细描述了每句台词的上下文信息。 数据结构:...
    packageimg