找到13个数据集

格式: ZIP 标签: 多语言分析

过滤结果
  • HTI_Based_草药靶点相互作用关系抽取数据集

    2026年1月31日 30 182 87

    数据集概述 本数据集为草药靶点相互作用(HTI)关系抽取数据集,包含中文与英文两种语言的草药靶点相关数据及摘要文件,涉及草药治疗疾病的临床应用、靶点蛋白关联等信息,可用于草药与靶点相互作用的关系挖掘研究,总计包含4个文件。 文件详解 HTI_abstracts_cn.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_主权国家标签描述别名RDF数据

    2026年1月29日 30 204 119

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF数据转储,仅包含主权国家相关信息,涵盖标签、描述及别名内容。数据集包含4个文件,无实体、陈述或三元组计数,可用于获取标准化的主权国家语义信息。 文件详解 info.json 文件格式:JSON...
    packageimg
  • 附录_42种语言定量定性分析结果_xlsx_多语言样本分析结果数据

    2026年1月27日 30 177 149

    数据集概述 本数据集展示基于42种语言样本的定量与定性分析结果,包含一份Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据,无子目录结构,聚焦多语言分析领域的核心结果呈现。 文件详解 文件名称:Appendix2b_Results_of_quantitative_qualitative_analysis_42_languages.xlsx...
    packageimg
  • Decesare_Based_堕胎立场实验研究_GPT模型生成预设分句数据

    2026年1月21日 30 60 52

    数据集概述 本数据集为论文“Pro-life, neutral or pro-choice? An experimental study on informative presupposition clefts generated by GPT-3.5 and GPT-4o in Italian, French and...
    packageimg
  • Wikidata_wdumps_Based_俄英名词语法性别RDF数据集_原始

    2026年1月19日 30 138 48

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,核心内容为包含语法性别的俄语、英语名词数据。数据集包含4个文件,涵盖JSON格式的配置与元数据文件、压缩的N-Triples数据文件及预览文件,可用于语义网络、自然语言处理等领域的相关研究。 文件详解 配置与元数据文件 文件名称:wdumper-spec.json...
    packageimg
  • amai_项目第四批公民科学家提交创意清单

    2025年12月9日 30 137 121

    数据集概述 本数据集收录了amai!项目第四批中公民科学家提交的创意清单,创意按气候、健康、出行和工作等主题进行分类聚合,所有内容仅提供荷兰语版本。 文件详解 文件名称: ClustersPosters.pdf 文件格式: PDF (.pdf) 内容说明: 包含按气候、健康、出行和工作主题分类的公民科学家提交创意清单,内容仅为荷兰语。 适用场景...
    packageimg
  • 瑞士新冠疫情主流媒体词汇与命名实体分析数据集

    2025年12月12日 30 86 73

    数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
    packageimg
  • 伊比利亚巴斯克地区电影与视听节数据集2022

    2025年12月9日 30 130 85

    数据集概述 本数据集收录了伊比利亚巴斯克地区(含西班牙巴斯克自治区、纳瓦拉自治区及法国巴斯克地区)2016-2018年收集并于2022年更新的电影与视听节信息,包含节庆、展览及竞赛活动,支持多语言分析。 文件详解 巴斯克语版本文件:...
    packageimg
  • 大数据分析驱动的制造企业优化数据集

    2025年12月5日 30 54 24

    数据集概述 该数据集包含一项调查结果,旨在识别大数据分析对制造企业转型的影响。数据涵盖一百五十四名制造企业员工的参与记录,其中一百三十三名完成了所有问题。数据集提供原始德语版本和翻译后的英语版本,编码格式为UTF8,支持多语言分析需求。 文件详解 说明文档:...
    packageimg
  • 组合评论语料库数据集

    2025年5月31日 30 52 32

    组合评论语料库数据集 数据来源:互联网公开数据 标签:毒性评论,语言偏见,多语言分析,文本分类,自然语言处理,社会媒体,情感分析 数据概述: 本数据集整合了过去三年内的评论数据,涵盖了来自多个公开数据集的内容。数据集主要来源于三个关键的比赛任务: 1. 毒性评论分类挑战(Toxic Comment Classification...
    packageimg
  • 欧洲足球俱乐部搜索排名数据集

    2025年4月15日 30 94 0

    欧洲足球俱乐部搜索排名数据集 数据来源:互联网公开数据 标签:足球俱乐部,搜索引擎排名,欧洲足球,多语言分析,搜索结果,行业趋势,品牌影响力 数据概述:...
    packageimg
  • 孟加拉语仇恨言论翻译数据集

    2025年4月14日 30 104 27

    孟加拉语仇恨言论翻译数据集 数据来源:互联网公开数据 标签:仇恨言论,孟加拉语,翻译,语言模型,多语言分析,文本分类,模型评估 数据概述:...
    packageimg