找到12,070个数据集

标签: 自然语言处理

过滤结果
  • 商品描述文本清洗数据集

    2025年9月30日   

    商品描述文本清洗数据集_Product_Description_Text_Cleaning_Dataset 数据来源:互联网公开数据 标签:文本清洗, 商品描述, 自然语言处理, 文本预处理, 数据集, 机器学习, 文本分析, 数据标注 数据概述: 该数据集包含来自电商平台或其他来源的商品描述文本,记录了经过清洗后的商品标题和要点信息。主要特征如下:...
    packageimg
  • 社交媒体评论情感分析嵌入数据集

    2025年9月29日   

    社交媒体评论情感分析嵌入数据集_Social_Media_Comment_Sentiment_Analysis_Embeddings 数据来源:互联网公开数据 标签:情感分析, 文本嵌入, 社交媒体, 自然语言处理, 情感分类, 评论数据, 机器学习, 语义分析 数据概述:...
    packageimg
  • 词向量相似度分析数据集

    2025年9月29日   

    词向量相似度分析数据集_Word_Embedding_Similarity_Analysis 数据来源:互联网公开数据 标签:词向量, 相似度计算, 自然语言处理, 文本分析, 机器学习, 嵌入, 语义分析, 数据集 数据概述: 该数据集包含基于词嵌入模型生成的词向量数据,用于评估和分析词语之间的语义相似度。主要特征如下:...
    packageimg
  • Jigsaw平台评论内容毒性分析数据集

    2025年9月27日   

    Jigsaw平台评论内容毒性分析数据集_Jigsaw_Platform_Comment_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 情感分析, 评论内容, 自然语言处理, 机器学习, 数据标注, 语义分析 数据概述:...
    packageimg
  • 文本结构化分析多语言数据集

    2025年9月27日   

    文本结构化分析多语言数据集_Text_Structural_Analysis_Multilingual_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言学, 结构化数据, 句法分析, 自然语言处理, 多语言, 深度学习, 文本特征 数据概述:...
    packageimg
  • 文本内容润色与改编指令数据集

    2025年9月27日   

    文本内容润色与改编指令数据集_Text_Content_Refinement_and_Adaptation_Instructions 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 文本生成, 内容改编, 指令数据集, 语义分析, 机器学习, 数据增强 数据概述:...
    packageimg
  • 教育研究论文文本分析数据集

    2025年9月27日   

    教育研究论文文本分析数据集_Education_Research_Paper_Text_Analysis 数据来源:互联网公开数据 标签:教育研究, 文本分析, 论文摘要, 自然语言处理, 文本分类, 标签提取, 学术研究, 数据清洗 数据概述: 该数据集包含来自教育研究领域的学术论文文本数据,主要用于文本分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 联合国大会演讲文本分析数据集

    2025年9月27日   

    联合国大会演讲文本分析数据集_UN_General_Debates_Speech_Text 数据来源:互联网公开数据 标签:联合国, 演讲文本, 自然语言处理, 文本分析, 政治, 历史, 情感分析, 文本挖掘 数据概述: 该数据集包含来自联合国大会的演讲文本数据,记录了历届联合国大会中各国代表的发言内容。主要特征如下:...
    packageimg
  • 股票市场情绪分析推文数据集

    2025年9月27日   

    股票市场情绪分析推文数据集_Stock_Market_Sentiment_Analysis_Tweets 数据来源:互联网公开数据 标签:股票市场, 情绪分析, 社交媒体, 文本挖掘, 机器学习, 自然语言处理, 情感分析, 股票代码 数据概述:...
    packageimg
  • 越南语文本纠错数据集

    2025年7月14日   

    越南语文本纠错数据集_Vietnamese_Text_Error_Correction_Dataset 数据来源:互联网公开数据 标签:文本纠错, 自然语言处理, 越南语, 错误检测, 语言模型, 深度学习, 数据标注, 文本校对 数据概述:...
    packageimg
  • 波兰社交平台评论数据

    2025年9月27日   

    波兰社交平台评论数据_Polish_Social_Platform_Comments 数据来源:互联网公开数据 标签:社交媒体, 评论分析, 文本数据, 时间序列, 自然语言处理, 情感分析, 舆情分析, 数据挖掘 数据概述: 该数据集包含来自波兰社交平台上的评论数据,记录了用户在不同时间段发布的评论内容及其相关信息。主要特征如下:...
    packageimg
  • 邮件文本内容分析数据集

    2025年9月26日   

    邮件文本内容分析数据集_Email_Text_Content_Analysis 数据来源:互联网公开数据 标签:邮件内容, 文本分析, 自然语言处理, 文本挖掘, 数据清洗, 信息提取, 邮件安全, 语料库 数据概述: 该数据集包含来自邮件文本的数据,记录了邮件的原始内容。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料库。...
    packageimg
  • 多语言文本嵌入特征数据集

    2025年9月26日   

    多语言文本嵌入特征数据集_Multilingual_Text_Embedding_Features 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 自然语言处理, 语义分析, 向量表示, 机器翻译, 情感分析, 预训练模型 数据概述: 该数据集包含基于distiluse-base-multilingual-...
    packageimg
  • 商品信息描述数据集

    2025年9月26日   

    商品信息描述数据集_Product_Information_Description_Dataset 数据来源:互联网公开数据 标签:商品描述, 文本分析, 商品推荐, 自然语言处理, 商品分类, 文本摘要, 机器学习, 产品属性 数据概述: 该数据集包含来自电商平台的商品描述信息,记录了各种商品的产品属性、标题、要点、以及详细描述。主要特征如下:...
    packageimg
  • 社交平台评论毒性识别数据集

    2025年9月26日   

    社交平台评论毒性识别数据集_Social_Platform_Comment_Toxicity_Identification 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 情感分析, 机器学习, 自然语言处理, 数据标注, 社交媒体 数据概述: 该数据集包含来自社交平台的用户评论文本数据,旨在用于识别评论中的毒性内容。主要特征如下:...
    packageimg
  • 文本情感分析模型训练与评估数据集

    2025年9月25日   

    文本情感分析模型训练与评估数据集_Text_Sentiment_Analysis_Model_Training_and_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 机器学习, 模型训练, 数据集构建, 自然语言处理, 评估指标, 深度学习 数据概述:...
    packageimg
  • 图书文本语料库预训练数据集

    2025年9月25日   

    图书文本语料库预训练数据集_Book_Text_Corpus_Pre_training_Dataset 数据来源:互联网公开数据 标签:文本预训练, 自然语言处理, 语料库, 文本数据, BERT, 对比学习, 语言模型, 机器学习 数据概述: 该数据集包含从书籍文本中提取的语料,记录了用于自然语言处理模型预训练的文本内容。主要特征如下:...
    packageimg
  • 商品搜索相关性评估数据集

    2025年9月24日   

    商品搜索相关性评估数据集_Product_Search_Relevance_Assessment 数据来源:互联网公开数据 标签:商品搜索, 相关性评估, 自然语言处理, 文本匹配, 多语言, 数据标注, 机器学习, 推荐系统 数据概述: 该数据集包含多个CSV文件,记录了用户查询与商品之间的相关性信息,用于评估和训练商品搜索相关性模型。主要特征如下:...
    packageimg
  • 越南新闻文章内容分类数据集

    2025年9月24日   

    越南新闻文章内容分类数据集_Vietnam_News_Articles_Content_Classification 数据来源:互联网公开数据 标签:新闻文章, 内容分类, 文本分析, 越南语, 自然语言处理, 机器学习, 时事新闻, 数据集 数据概述:...
    packageimg
  • 职业招聘文本与技能分析数据集

    2025年9月24日   

    职业招聘文本与技能分析数据集_Job_Recruitment_Text_and_Skill_Analysis_Dataset 数据来源:互联网公开数据 标签: 招聘数据, 简历分析, 技能提取, 文本挖掘, 自然语言处理, 职业分类, 文本分类, 机器学习 数据概述:...
    packageimg