找到11,756个数据集

标签: 自然语言处理

过滤结果
  • 德语英语翻译数据集255817样本

    2025年4月15日   

    德语英语翻译数据集255817样本 数据来源:互联网公开数据 标签:德语,英语,翻译,自然语言处理,深度学习,数据预处理,语言模型 数据概述:...
    packageimg
  • 毒性数据集

    2025年4月15日   

    毒性数据集 数据来源:互联网公开数据 标签:毒性,文本分析,自然语言处理,机器学习,内容审核,社交媒体,网络言论 数据概述: 本数据集收录了多种来源的文本数据,涵盖社交媒体评论、论坛帖子、新闻评论等,主要用于识别和分析其中的毒性内容。数据集标注了不同类型的毒性评论,如侮辱、威胁、歧视等,为研究文本中的不良内容提供了丰富的样本。 数据用途概述:...
    packageimg
  • 猫途鹰酒店评论情感分析数据集

    2025年4月15日   

    猫途鹰酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,语义分析,用户评价,文本数据,旅游,消费者行为,自然语言处理 数据概述:...
    packageimg
  • 谷歌搜索关键词与用户行为分析数据集-2019

    2025年4月15日   

    谷歌搜索关键词与用户行为分析数据集-2019 数据来源:互联网公开数据 标签:谷歌搜索,关键词,用户行为,搜索分析,数据挖掘,自然语言处理,点击率,搜索趋势 数据概述:...
    packageimg
  • 带标签网站文本内容数据集

    2025年4月15日   

    带标签网站文本内容数据集 数据来源:互联网公开数据 标签:网站文本,标签数据,内容分析,自然语言处理,机器学习,分类算法,网站分类 数据概述: 本数据集包含13,500个网站的URL及其对应的文本内容。数据集中共有9个不同的类别,涵盖了多种类型的网站。网站的文本内容未经过预处理,使用者可以根据需要自行进行预处理。 数据用途概述:...
    packageimg
  • 亚马逊客户评论服装类数据集

    2025年4月15日   

    亚马逊客户评论服装类数据集 数据来源:互联网公开数据 标签:服装,客户评论,评分系统,自然语言处理,机器学习,情感分析,用户行为,产品评价,数据挖掘 数据概述:...
    packageimg
  • 巴西葡萄牙语讽刺与讽刺数据集

    2025年4月15日   

    巴西葡萄牙语讽刺与讽刺数据集 数据来源:互联网公开数据 标签:讽刺,讽刺检测,巴西葡萄牙语,自然语言处理,文本分析,情感分析,社交媒体分析 数据概述: 本数据集是从2021年3月20日Fabio Ricardo Araujo da Silva和Andreia Gentil Bonfante在https://github.com/fabio-...
    packageimg
  • YouTube-Twitter和短信垃圾信息数据集

    2025年4月15日   

    YouTube-Twitter和短信垃圾信息数据集 数据来源:互联网公开数据 标签:垃圾信息,短信,社交媒体,YouTube,Twitter,文本数据,自然语言处理,垃圾邮件检测 数据概述: 本数据集整合了多个公开的垃圾信息数据集,旨在为垃圾信息检测、文本分类等研究提供数据资源。数据集主要由三部分组成:...
    packageimg
  • 银行客户推文情感分析数据集

    2025年4月15日   

    银行客户推文情感分析数据集 数据来源:互联网公开数据 标签:银行,客户,推文,情感分析,尼日利亚,社交媒体,文本数据,自然语言处理 数据概述:...
    packageimg
  • 西班牙科技领域推特用户互动数据集-推特用户-2024年

    2025年4月15日   

    西班牙科技领域推特用户互动数据集-推特用户-2024年 数据来源:互联网公开数据 标签:推特,社交媒体,科技,西班牙语,数据分析,自然语言处理,社交网络,科技影响者,舆情分析 数据概述:...
    packageimg
  • 人工智能语言检测软件训练数据集

    2025年4月15日   

    人工智能语言检测软件训练数据集 数据来源:互联网公开数据 标签:人工智能,语言检测,NLP,自然语言处理,开源软件,Naive Bayes算法,数据处理,机器学习 数据概述: 本数据集是用于训练人工智能语言检测软件的数据集合,由资深人工智能工程师Emirhan BULUT开发并公开分享。数据集涵盖了多种语言文本样本,用于训练和优化Naive...
    packageimg
  • 多领域文本蕴含语料库数据集

    2025年4月15日   

    多领域文本蕴含语料库数据集 数据来源:互联网公开数据 标签:文本蕴含,自然语言处理,跨领域泛化,语言推理,机器学习,深度学习,NLP 数据概述:...
    packageimg
  • 万圣节热门服装亚马逊评论数据集

    2025年4月15日   

    万圣节热门服装亚马逊评论数据集 数据来源:互联网公开数据 标签:万圣节服装,亚马逊,用户评论,自然语言处理,NLP,文本分析,评分预测,时间序列,产品评价 数据概述:...
    packageimg
  • 山区命名实体识别数据集

    2025年4月15日   

    山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。...
    packageimg
  • 印度尼西亚反论语料库数据集2023

    2025年4月15日   

    印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro...
    packageimg
  • 阿拉伯语新闻文本分类语料库

    2025年4月15日   

    阿拉伯语新闻文本分类语料库 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,机器学习,语料库 数据概述: 本数据集包含以阿拉伯语撰写的新闻文本,涵盖了9个不同的新闻类别,以CSV格式存储。数据集旨在为阿拉伯语新闻文本的分类任务提供支持,包含数万条新闻数据,每条数据均标注了具体的类别信息。 数据用途概述:...
    packageimg
  • 维基百科医学问答数据集

    2025年4月15日   

    维基百科医学问答数据集 数据来源:互联网公开数据 标签:医学问答,波斯语,自然语言处理,问答系统,医学知识,知识提取 数据概述:...
    packageimg
  • 法语目的地和起点映射数据集

    2025年4月15日   

    法语目的地和起点映射数据集 数据来源:互联网公开数据 标签:法语,地理定位,自然语言处理,方向描述,时间查询,句子结构分析,地理信息系统 数据概述:...
    packageimg
  • 亚马逊电子产品评论情感分析数据集

    2025年4月15日   

    亚马逊电子产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,电子产品,评论,情感分析,消费者行为,文本数据,机器学习,自然语言处理 数据概述: 本数据集包含约3000条来自亚马逊电子产品部门的约200个产品的产品评论,旨在用于深入理解亚马逊平台上产品的用户情感。数据集包含了用户对产品的文字评价,为情感分析提供了基础。...
    packageimg
  • 生成式语言模型文章数据集

    2025年4月15日   

    生成式语言模型文章数据集 数据来源:互联网公开数据 标签:生成式语言模型,文章生成,自然语言处理,文本检测,机器学习,深度学习,LLM 数据概述: 本数据集由GPT4、GPT2、Mistral和Gemma四种生成式语言模型生成,涵盖了一个特定的作文提示,该提示来自Kaggle的llm-detect-ai-generated-...
    packageimg