找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 网络攻击性言论数据集

    2025年4月14日   

    网络攻击性言论数据集 数据来源:互联网公开数据 标签:仇恨言论,攻击性言论,社交媒体,内容审核,自然语言处理,文本分析,社会问题 数据概述:...
    packageimg
  • arXiv论文摘要与嵌入向量每日更新数据集

    2025年4月14日   

    arXiv论文摘要与嵌入向量每日更新数据集 数据来源:互联网公开数据 标签:arXiv,论文,摘要,嵌入向量,自然语言处理,机器学习,科研,学术,每日更新 数据概述: 本数据集包含每日arXiv论文的标题、摘要以及对应的嵌入向量。数据集每天更新,其中不包含周六、周日及节假日的论文。嵌入向量的计算方法详见提供的Notebook文件。...
    packageimg
  • 德语问答数据集

    2025年4月14日   

    德语问答数据集 数据来源:互联网公开数据 标签:德语问答,自然语言处理,机器学习,问答系统,数据标注,德语分析,跨语言学习 数据概述:...
    packageimg
  • Steam游戏评论关键要素标注数据集-英语评论-2024

    2025年4月14日   

    Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • 推特情感分析STS-Gold数据集

    2025年4月14日   

    推特情感分析STS-Gold数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,社交媒体,情感极性,机器学习,自然语言处理 数据概述: 本数据集由Saif等人(2013)创建,包含2026条推文及其对应的ID和情感极性标签。这些推文用于训练情感分析模型。若使用本数据集,请引用原论文。 原论文引用:Saif, H., Fernandez,...
    packageimg
  • 印度时报新闻数据集

    2025年4月14日   

    印度时报新闻数据集 数据来源:互联网公开数据 标签:印度时报,政治新闻,媒体分析,新闻趋势,情感分析,命名实体识别,主题建模,自然语言处理 数据概述:...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • 学术引用意图分类数据集

    2025年4月14日   

    学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface...
    packageimg
  • 亚马逊产品评论情感分析数据集

    2025年4月14日   

    亚马逊产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,产品评论,情感分析,消费者反馈,市场研究,自然语言处理,数据分析 数据概述: 本数据集包含了亚马逊平台上各类产品的客户评论,涵盖了广泛的消费产品,提供了宝贵的消费者意见和情感见解。数据集中的评论内容丰富多样,有助于了解不同产品在消费者心中的表现和评价。 数据用途概述:...
    packageimg
  • wikiHow文章读者反馈与文章特征关联数据集

    2025年4月14日   

    wikiHow文章读者反馈与文章特征关联数据集 数据来源:互联网公开数据 标签:wikiHow,文章质量,读者反馈,自然语言处理,机器学习,文章分析,内容评估 数据概述:...
    packageimg
  • 垃圾邮件分类邮件数据集

    2025年4月14日   

    垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:...
    packageimg
  • 斯瓦希里语自然语言处理数据集

    2025年4月14日   

    斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:...
    packageimg
  • 葡萄牙语文本到SQL查询生成数据集2023

    2025年4月14日   

    葡萄牙语文本到SQL查询生成数据集2023 数据来源:互联网公开数据 标签:葡萄牙语,文本到SQL,自然语言处理,机器学习,数据库 数据概述: 本数据集是b-mc2/sql-create-context数据集的葡萄牙语翻译版本,基于WikiSQL和Spider数据集构建。数据集包含了葡萄牙语问题、SQL CREATE...
    packageimg
  • 阿拉伯语推特情感分析数据集

    2025年4月14日   

    阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:...
    packageimg
  • 希腊语COVID-19疫苗接种推文数据集

    2025年4月14日   

    希腊语COVID-19疫苗接种推文数据集 数据来源:互联网公开数据 标签:希腊语,COVID-19,疫苗接种,社交媒体分析,自然语言处理,文本分类,公共卫生,数据标注 数据概述: 本数据集包含2021年7月至8月期间收集的希腊语推文,内容聚焦于COVID-19疫苗接种相关话题。数据集中的推文经过人工标注,为研究希腊语社交媒体内容提供了高质量的文本资源。...
    packageimg
  • 写作者数据集

    2025年4月14日   

    写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:...
    packageimg
  • 孟加拉语动词理解数据集

    2025年4月14日   

    孟加拉语动词理解数据集 数据来源:互联网公开数据 标签:孟加拉语,动词,词根映射,词性标注,自然语言处理,语境分析,形态学分析 数据概述...
    packageimg
  • 印度尼西亚至土耳其患者医生问答数据集1963-2021

    2025年4月14日   

    印度尼西亚至土耳其患者医生问答数据集1963-2021 数据来源:互联网公开数据 标签:患者,医生,问答,翻译,医学,自然语言处理,教育 数据概述:...
    packageimg
  • OpenAIHumanEval代码生成评估数据集

    2025年4月14日   

    OpenAIHumanEval代码生成评估数据集 数据来源:互联网公开数据 标签:代码生成,自然语言处理,编程,Python,模型评估,机器学习,Hugging Face,OpenAI,编程问题,单元测试 数据概述:...
    packageimg
  • WhatsApp聊天记录分析数据集

    2025年4月14日   

    WhatsApp聊天记录分析数据集 数据来源:互联网公开数据 标签:WhatsApp,聊天记录,社交媒体,数据分析,项目实践,初学者,数据挖掘,自然语言处理 数据概述:...
    packageimg