找到380个数据集

标签: 多语言

过滤结果
  • 自然语言处理数据增强用反向翻译数据集

    2025年4月15日   

    自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear...
    packageimg
  • Twitch多语言用户社交网络数据集2018年5月

    2025年4月15日   

    Twitch多语言用户社交网络数据集2018年5月 数据来源:互联网公开数据 标签:Twitch, 社交网络, 多语言, 用户互动, 图数据, 节点分类, 网络分析 数据概述:...
    packageimg
  • 电视剧与电影数据集

    2025年4月14日   

    电视剧与电影数据集 数据来源:互联网公开数据 标签:电视剧,电影,多语言,娱乐产业,流媒体平台,内容分析,观众研究 数据概述:...
    packageimg
  • 格言与警句数据集

    2025年4月14日   

    格言与警句数据集 数据来源:互联网公开数据 标签:格言,警句,谚语,多语言,文化,历史,人文,哲学 数据概述:...
    packageimg
  • 大型语言模型训练问答数据集1963-2021

    2025年4月14日   

    大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:...
    packageimg
  • 亚马逊商品评论多语言情感分析数据集

    2025年4月14日   

    亚马逊商品评论多语言情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,评论数据,情感分析,多语言,用户评价,文本挖掘,NLP,机器学习,商品推荐,用户体验 数据概述:...
    packageimg
  • YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024

    2025年4月14日   

    YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024 数据来源:互联网公开数据 标签:YouTube,视频评论,情感分析,自然语言处理,多语言,韩国,美食,社交媒体,用户互动 数据概述:...
    packageimg
  • 多语言维基百科命名实体识别数据集

    2025年4月14日   

    多语言维基百科命名实体识别数据集 数据来源:互联网公开数据 标签:多语言,维基百科,命名实体识别,PER,LOC,ORG,MISC,自然语言处理,机器学习 数据概述:...
    packageimg
  • 越南语聊天机器人问题与答案数据集-版本2

    2025年4月14日   

    越南语聊天机器人问题与答案数据集-版本2 数据来源:互联网公开数据 标签:越南语,聊天机器人,问答系统,自然语言处理,多语言,用户交互,对话数据 数据概述:...
    packageimg
  • 印地语等多种语言Quora问答对数据集

    2025年4月14日   

    印地语等多种语言Quora问答对数据集 数据来源:互联网公开数据 标签:问答对, Quora, 多语言, 印地语, 奥里亚语, 孟加拉语, 古吉拉特语, 马拉地语, 泰米尔语, 旁遮普语, 自然语言处理, 文本分析 数据概述: 本数据集包含3300对来自原始Quora问答对数据集的问答对。...
    packageimg
  • Spotify平台语言学习播客资源数据集

    2025年4月14日   

    Spotify平台语言学习播客资源数据集 数据来源:互联网公开数据 标签:Spotify,播客,语言学习,多语言,教育,音频,流媒体,文化交流 数据概述:...
    packageimg
  • 英特尔RaptorLake处理器发布推特舆情数据集-2022年10月

    2025年4月14日   

    英特尔RaptorLake处理器发布推特舆情数据集-2022年10月 数据来源:互联网公开数据 标签:推特,舆情分析,Raptor Lake,英特尔,处理器,社交媒体,发布,多语言 数据概述: 本数据集收录了2022年10月20日至2022年10月27日期间,关于英特尔Raptor...
    packageimg
  • 肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间

    2025年4月14日   

    肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,肯尼亚,选举,多语言,代码切换,文本分类,自然语言处理,情感分析 数据概述:...
    packageimg
  • 多语言命名实体识别数据集英语

    2025年4月14日   

    多语言命名实体识别数据集英语 数据来源:互联网公开数据 标签:多语言,命名实体识别,PER,LOC,ORG,MISC,自然语言处理 数据概述: 本数据集为多语言命名实体识别任务提供了一个经过处理的数据集版本,主要来源于GitHub项目(https://github.com/afshinrahimi/mmner),并在Amazon Cloud...
    packageimg
  • 印度尼泊尔酒店评论数据集多语言版

    2025年4月14日   

    印度尼泊尔酒店评论数据集多语言版 数据来源:互联网公开数据 标签:酒店评论,印度,尼泊尔,多语言,客户反馈,旅游分析 数据概述: 本数据集包含了印度和尼泊尔酒店的客户评论,评论内容分别以泰米尔语、尼泊尔语和英语呈现。数据集涵盖了大量不同语言的评论,为研究多语言客户反馈提供了丰富素材。 数据用途概述:...
    packageimg
  • 多语言有毒言论检测数据集2023

    2025年4月14日   

    多语言有毒言论检测数据集2023 数据来源:互联网公开数据 标签:有毒言论,社交媒体,自然语言处理,多语言,文本分类,情感分析,言论监测 数据概述: 本数据集收录了用法语、英语和阿拉伯语标注的推文,每条推文被标记为有毒或非有毒。数据集中,标签0表示非有毒推文,标签1表示有毒推文。该数据集为研究多语言环境下的有毒言论提供了丰富的资源。 数据用途概述:...
    packageimg
  • 多语言灾害响应消息数据集

    2025年4月14日   

    多语言灾害响应消息数据集 数据来源:互联网公开数据 标签:灾害响应,多语言,消息分类,自然语言处理,文本分析,紧急救援,机器学习 数据概述:...
    packageimg
  • Gaana平台歌曲信息数据集-多语言歌曲-4-5万首

    2025年4月14日   

    Gaana平台歌曲信息数据集-多语言歌曲-4-5万首 数据来源:互联网公开数据 标签:音乐,歌曲,Gaana,音频,流媒体,印度,多语言,歌曲信息,元数据 数据概述: 本数据集收录了Gaana.com平台上约4.5万首来自不同语言的歌曲信息。数据涵盖了歌曲的多种关键属性,例如歌曲标题、艺术家、专辑、语言、流派等,为音乐研究和应用提供了丰富的数据资源。...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • IMDb高分动作电影票房及影评数据集-多语言电影

    2025年4月14日   

    IMDb高分动作电影票房及影评数据集-多语言电影 数据来源:互联网公开数据 标签:动作电影,IMDb,电影票房,影评,多语言,英语,泰米尔语,中文,法语,电影数据 数据概述:...
    packageimg