找到587个数据集

标签: NLP

过滤结果
  • 中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers

    2025年4月24日   

    中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,中文分词,数据集,文本分析,机器学习,语言处理,NLP,中文处理 数据概述: 该数据集包含中文文本的分词数据,记录了从01月01日到03月31日之间的中文文本的分词结果。主要特征如下:...
    packageimg
  • 斯坦福问答数据集SQuAD-donutkashvi

    2025年4月24日   

    斯坦福问答数据集SQuAD-donutkashvi 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器阅读理解,文本理解,深度学习,人工智能,NLP 数据概述: 该数据集包含了斯坦福大学开发的问答数据集,用于评估机器阅读理解能力。主要特征如下:...
    packageimg
  • LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806

    2025年4月24日   

    LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806 数据来源:互联网公开数据 标签:LinkedIn,用户评论,情感分析,NLP,社交媒体,用户行为,文本挖掘,情感识别 数据概述:...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 孟加拉语社交媒体新闻操控识别数据集2023-mozaman36

    2025年4月24日   

    孟加拉语社交媒体新闻操控识别数据集2023-mozaman36 数据来源:互联网公开数据 标签:孟加拉语,社交媒体,新闻操控,数据集,NLP,信息识别,假新闻检测,计算术语 数据概述:...
    packageimg
  • MBTI人格类型与恋爱主题文本数据集-yamaerenay

    2025年4月24日   

    MBTI人格类型与恋爱主题文本数据集-yamaerenay 数据来源:互联网公开数据 标签:MBTI,人格类型,恋爱,文本分析,NLP,分类,关键词提取,Enneagram,心理学 数据概述:...
    packageimg
  • AlpacaGPT-4指令跟随推理数据集-2023-thedevastator

    2025年4月24日   

    AlpacaGPT-4指令跟随推理数据集-2023-thedevastator 数据来源:互联网公开数据 标签:NLP,指令跟随,自然语言处理,机器学习,研究,教育,人工智能,科学,推理 数据概述:...
    packageimg
  • 美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh

    2025年4月24日   

    美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh 数据来源:互联网公开数据 标签:事实核查,言论真实性,美国,政治,新闻,数据,分析,NLP 数据概述:...
    packageimg
  • WordNet超义词数据集-2006-duketemon

    2025年4月24日   

    WordNet超义词数据集-2006-duketemon 数据来源:互联网公开数据 标签:WordNet,超义词,语义关系,自然语言处理,NLP,语言学,数据集 数据概述:...
    packageimg
  • 英-马尔地语双语翻译数据集-mayakaripel

    2025年4月24日   

    英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-...
    packageimg
  • 动漫名言数据集-2023-thegame

    2025年4月24日   

    动漫名言数据集-2023-thegame 数据来源:互联网公开数据 标签:动漫,名言,角色,情感分析,NLP,生成式AI,对话系统 数据概述: 本数据集包含来自822部不同动漫作品的约8500条独特名言,涉及2,391个不同的角色。每条记录包括动漫名称、角色姓名以及该角色所说的话语。数据集涵盖了广泛的主题和风格,为自然语言处理任务提供了丰富的素材。...
    packageimg
  • PDF文档摘要提取数据集DrivePDFDataset-atif10

    2025年4月24日   

    PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...
    packageimg
  • 英法翻译数据集English-FrenchTranslationDataset-endofnight17j03

    2025年4月24日   

    英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...
    packageimg
  • 惠而浦印度员工评价数据集-manishkr1754

    2025年4月24日   

    惠而浦印度员工评价数据集-manishkr1754 数据来源:互联网公开数据 标签:员工评价,惠而浦印度,工作环境,公司文化,数据挖掘,NLP,情感分析,研究资源 数据概述: 惠而浦印度员工评价数据集汇集了来自Ambition Box平台的惠而浦印度员工评论。Ambition...
    packageimg
  • StackExchange网站标签数据集-202个网站-2020年-shivkumarganesh

    2025年4月24日   

    StackExchange网站标签数据集-202个网站-2020年-shivkumarganesh 数据来源:互联网公开数据 标签:StackExchange,网站标签,NLP,数据挖掘,社区建设,技术论坛,数据集 数据概述:...
    packageimg
  • Valuelabs机器学习黑客松问答组合数据集-veeralakrishna

    2025年4月24日   

    Valuelabs机器学习黑客松问答组合数据集-veeralakrishna 数据来源:互联网公开数据 标签:NLP,语义相似性,自动生成文本,问答系统,机器学习,黑客松 数据概述: 本数据集包含用于Valuelabs机器学习黑客松比赛的问答组合数据,涉及自然语言处理中的上下文语义相似性和自动生成功能。数据集中的每个问题-...
    packageimg
  • Yelp餐饮点评情感分析数据集训练集-测试集

    2025年4月24日   

    Yelp餐饮点评情感分析数据集训练集-测试集 数据来源:互联网公开数据 标签:情感分析,文本分类,Yelp,点评,NLP,自然语言处理,机器学习,用户评论,情感极性,文本数据 数据概述:...
    packageimg
  • 印度IMDBTop3000电影数据集-2021年-saikrishnadupp

    2025年4月24日   

    印度IMDBTop3000电影数据集-2021年-saikrishnadupp 数据来源:互联网公开数据 标签:IMDB,印度电影,Bollywood,电影推荐,数据可视化,NLP,电影分析 数据概述:...
    packageimg
  • 基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99

    2025年4月23日   

    基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99 数据来源:互联网公开数据 标签:钓鱼欺诈检测,自然语言处理,NLP,邮件安全,机器学习,文本分析,欺诈识别,安全防护 数据概述:...
    packageimg
  • 德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch

    2025年4月23日   

    德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-...
    packageimg