找到7个数据集

标签: 多语言分析

过滤结果
  • amai_项目第四批公民科学家提交创意清单

    2025年12月9日 30 126 112

    数据集概述 本数据集收录了amai!项目第四批中公民科学家提交的创意清单,创意按气候、健康、出行和工作等主题进行分类聚合,所有内容仅提供荷兰语版本。 文件详解 文件名称: ClustersPosters.pdf 文件格式: PDF (.pdf) 内容说明: 包含按气候、健康、出行和工作主题分类的公民科学家提交创意清单,内容仅为荷兰语。 适用场景...
    packageimg
  • 瑞士新冠疫情主流媒体词汇与命名实体分析数据集

    2025年12月12日 30 74 70

    数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
    packageimg
  • 伊比利亚巴斯克地区电影与视听节数据集2022

    2025年12月9日 30 36 19

    数据集概述 本数据集收录了伊比利亚巴斯克地区(含西班牙巴斯克自治区、纳瓦拉自治区及法国巴斯克地区)2016-2018年收集并于2022年更新的电影与视听节信息,包含节庆、展览及竞赛活动,支持多语言分析。 文件详解 巴斯克语版本文件:...
    packageimg
  • 大数据分析驱动的制造企业优化数据集

    2025年12月5日 30 106 45

    数据集概述 该数据集包含一项调查结果,旨在识别大数据分析对制造企业转型的影响。数据涵盖一百五十四名制造企业员工的参与记录,其中一百三十三名完成了所有问题。数据集提供原始德语版本和翻译后的英语版本,编码格式为UTF8,支持多语言分析需求。 文件详解 说明文档:...
    packageimg
  • 组合评论语料库数据集

    2025年5月31日 30 152 15

    组合评论语料库数据集 数据来源:互联网公开数据 标签:毒性评论,语言偏见,多语言分析,文本分类,自然语言处理,社会媒体,情感分析 数据概述: 本数据集整合了过去三年内的评论数据,涵盖了来自多个公开数据集的内容。数据集主要来源于三个关键的比赛任务: 1. 毒性评论分类挑战(Toxic Comment Classification...
    packageimg
  • 欧洲足球俱乐部搜索排名数据集

    2025年4月15日 30 170 102

    欧洲足球俱乐部搜索排名数据集 数据来源:互联网公开数据 标签:足球俱乐部,搜索引擎排名,欧洲足球,多语言分析,搜索结果,行业趋势,品牌影响力 数据概述:...
    packageimg
  • 孟加拉语仇恨言论翻译数据集

    2025年4月14日 30 141 99

    孟加拉语仇恨言论翻译数据集 数据来源:互联网公开数据 标签:仇恨言论,孟加拉语,翻译,语言模型,多语言分析,文本分类,模型评估 数据概述:...
    packageimg