找到5,805个数据集

标签: 文本分析

过滤结果
  • 尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey

    2025年4月23日   

    尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey 数据来源:互联网公开数据 标签:酒店评论,尼泊尔,旅游,情感分析,自然语言处理,数据集,文本分析,豪华酒店 数据概述: 该数据集包含来自互联网的尼泊尔豪华酒店评论数据,记录了游客对尼泊尔豪华酒店的评价和反馈。主要特征如下:...
    packageimg
  • 印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2

    2025年4月23日   

    印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:...
    packageimg
  • 宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl

    2025年4月23日   

    宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl 数据来源:互联网公开数据 标签:情感分析,实体识别,宠物领养,数据集,自然语言处理,机器学习,文本分析,社会科学研究 数据概述:该数据集包含来自Petfinder的数据,记录了用户在领养宠物时发表的评论,适用于情感分析和实体识别等任务。主要特征如下:...
    packageimg
  • 罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu

    2025年4月23日   

    罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:...
    packageimg
  • 乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan

    2025年4月23日   

    乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:...
    packageimg
  • 阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi

    2025年4月23日   

    阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi 数据来源:互联网公开数据 标签:阿拉伯语,文本分析,数据集,社交媒体,机器学习,情感分析,自然语言处理,情感识别 数据概述:...
    packageimg
  • 大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen

    2025年4月23日   

    大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:...
    packageimg
  • 印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906

    2025年4月23日   

    印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906 数据来源:互联网公开数据 标签:印度,BERT,微调,自然语言处理,机器学习,数据集,文本分析,人工智能 数据概述:该数据集包含来自印度的各种文本数据,适用于BERT模型的微调和自然语言处理任务。主要特征如下:...
    packageimg
  • 英语翻译数据集EnglishTranslatedDataset-tasnim34

    2025年4月23日   

    英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh

    2025年4月23日   

    越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:...
    packageimg
  • 全球顶尖跨国公司MNCs社交媒体数据分析数据集-nirbhayk

    2025年4月23日   

    全球顶尖跨国公司MNCs社交媒体数据分析数据集-nirbhayk 数据来源:互联网公开数据 标签:跨国公司,社交媒体,数据集,品牌分析,市场营销,文本分析,舆情分析,商业智能 数据概述: 该数据集包含了来自社交媒体平台的数据,记录了全球顶尖跨国公司(MNCs)的社交媒体活动和用户互动信息。主要特征如下:...
    packageimg
  • Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev

    2025年4月23日   

    Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev 数据来源:互联网公开数据 标签:数据集,合成数据,文本分析,机器学习,自然语言处理,数据挖掘,文档处理,人工智能 数据概述: 该数据集包含来自Kaggle平台文档的合成数据,记录了文档内容的结构化信息。主要特征如下:...
    packageimg
  • 标注词语数据集AnnotatedWordsDataset-abdelhakch

    2025年4月23日   

    标注词语数据集AnnotatedWordsDataset-abdelhakch 数据来源:互联网公开数据 标签:词语标注,自然语言处理,数据集,文本分析,机器学习,语言学,词性标注,学术研究 数据概述:该数据集包含来自互联网公开资源的词语标注数据,记录了词语的详细信息及其在文本中的作用。主要特征如下:...
    packageimg
  • 推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh

    2025年4月23日   

    推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh 数据来源:互联网公开数据 标签:情感分析,推特数据,航空公司,自然语言处理,文本分析,机器学习,舆情分析,社交媒体 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要记录了用户对航空公司的情感反馈。主要特征如下:...
    packageimg
  • PDF文件转CSV转换数据集-chadapamettapun

    2025年4月23日   

    PDF文件转CSV转换数据集-chadapamettapun 数据来源:互联网公开数据 标签:数据转换,PDF转CSV,数据处理,文本分析,文件格式转换,机器学习,数据挖掘,Python 数据概述:该数据集包含PDF文件转CSV转换的数据,记录了PDF文件转换为CSV文件的过程和结果。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr

    2025年4月23日   

    电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,网络安全,信息过滤 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了大量标记为垃圾邮件和非垃圾邮件的电子邮件内容。主要特征如下:...
    packageimg
  • 商业与非商业许可证分类数据集-2023-moxxis

    2025年4月23日   

    商业与非商业许可证分类数据集-2023-moxxis 数据来源:互联网公开数据 标签:许可证分类,商业,非商业,句子分割,平衡数据集,机器学习,文本分析 数据概述:...
    packageimg
  • 欧洲人权法院案件分析数据集ECHRDataset-subodh3

    2025年4月23日   

    欧洲人权法院案件分析数据集ECHRDataset-subodh3 数据来源:互联网公开数据 标签:人权,法律,数据集,法院,案例分析,文本分析,自然语言处理,司法 数据概述: 该数据集包含了欧洲人权法院(ECHR)的案件数据,记录了法院审理的各类人权案件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了欧洲人权法院成立至今的案件。...
    packageimg
  • 电子邮件垃圾邮件分类数据集-2021-nubrin

    2025年4月23日   

    电子邮件垃圾邮件分类数据集-2021-nubrin 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,分类,数据集,文本分析,机器学习,特征提取 数据概述:...
    packageimg
  • 俄罗斯零售市场内容数据集-2023年-pavelkunitsyn

    2025年4月23日   

    俄罗斯零售市场内容数据集-2023年-pavelkunitsyn 数据来源:互联网公开数据 标签:零售业,俄罗斯,市场分析,自然语言处理,文本分析,竞争分析,地理分析 数据概述:...
    packageimg