找到124个数据集

标签: 跨语言对比

过滤结果
  • Snowclones_Master_多语言使用者认知与使用调查问卷数据

    2026年1月26日 30 176 5

    数据集概述 本数据集包含3份针对法语、英语、俄语使用者的调查问卷,是硕士论文《Snowclones研究》的配套调查工具,旨在收集使用者对snowclones结构的感知与使用情况,为语言学中snowclones现象的研究提供基础数据。 文件详解 文件名称:Questionnaire SC anglais.docx 文件格式:DOCX...
    packageimg
  • VnEmoLex_Based越南语情感词典数据

    2026年2月1日 30 73 37

    数据集概述 本数据集为越南语情感词典VnEmoLex,包含一万二千七百九十五个越南语词汇,标注了喜悦、悲伤、愤怒、恐惧、信任、厌恶、惊讶、期待八种基础情感。词典基于NRC情感词典和越南语词网构建,可用于越南语文本的情感强度分析,为越南语情感研究提供结构化词汇资源。 文件详解 文件名称:VnEmoLex.xlsx 文件格式:XLSX...
    packageimg
  • FDM_Based_研究数据管理德语材料目录数据

    2026年2月1日 30 143 118

    数据集概述 本数据集为德语研究数据管理主题的材料目录,包含培训演示文稿、视频、模板等各类德语资源的目录信息,提供两种格式的文件版本,便于用户查阅和使用研究数据管理相关的德语学习与工作材料。 文件详解 文件名称:FDM-Materialkatalog-v1.ods 文件格式:ODS...
    packageimg
  • ILR_RAS_新约多谓词原因结构语境数据库_1_1版

    2026年1月31日 30 132 59

    数据集概述 本数据集为新约文本中含多谓词原因结构的语境数据库,包含1630个原因语境(来自1504个经文),通过俄、英、法三种语言新约译本的原因连词自动提取并人工编辑生成,可用于单语言及类型学研究。另含86个语境的试点标注子样本,标注内容包括语义语用类型与信息结构。 文件详解 主数据库文件...
    packageimg
  • KOLLMEIER_Based汉印佛教词汇比较对照数据

    2026年1月30日 30 147 4

    数据集概述 本数据集为汉印佛教词汇比较对照表,聚焦汉语与印度语系佛教词汇的对比研究,包含一份核心文件,可用于语言学、宗教学领域的词汇语义分析与跨语言对比研究。 文件详解 文件名称:KOLLMEIER version 1.xlsx 文件格式:XLSX...
    packageimg
  • CLDF_Based_List部分共现推断数据集2023

    2026年1月30日 30 182 63

    数据集概述 本数据集是List在2023年发表的《Inference of partial colexifications》研究的配套CLDF数据集,基于Key和Comrie2021年的《Intercontinental Dictionary Series》构建,用于语言学中部分共现现象的推断研究,包含1个压缩文件。 文件详解 压缩包文件...
    packageimg
  • xflr6_Source_人称合并词类型学评估补充材料数据

    2026年1月30日 30 80 65

    数据集概述 本数据集是论文《Assessing the typology of person portmanteaus》的补充材料,包含1个压缩文件,用于支撑人称合并词类型学的研究评估,为语言学领域相关分析提供辅助数据支持。 文件详解 文件名称:xflr6/portmanteaus-v1.0.zip 文件格式:ZIP...
    packageimg
  • 孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集

    2026年1月28日 30 57 19

    数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
    packageimg
  • Green_Energy_Tweet_英文土耳其绿色能源推文数据

    2026年1月28日 0 91 28

    数据集概述 本数据集包含关于绿色能源主题的英文和土耳其语推文数据,仅涉及一份文件,主要记录社交媒体中绿色能源相关的用户发布内容,为绿色能源主题的社交媒体研究提供基础数据支持。 文件详解 文件名称:Green.xlsx 文件格式:XLSX...
    packageimg
  • Source_Concepts_Based非洲语言源概念研究数据

    2026年1月28日 30 26 15

    数据集概述 本数据集是论文“Mouths, tongues, and ears: Source concepts for 'language' across Africa”配套的Excel表格数据,包含非洲语言中“语言”相关源概念的研究数据,共1个文件,用于支撑非洲语言概念系统的分析研究。 文件详解...
    packageimg
  • NLUCat_Based_加泰罗尼亚语NLU意图与槽位标注数据集

    2026年1月28日 30 204 149

    数据集概述 本数据集为加泰罗尼亚语的自然语言理解(NLU)数据集,包含近1.2万条标注指令,涵盖虚拟家庭助手常用意图及弱势群体的社会、医疗需求意图,标注细粒度槽位并考虑加泰罗尼亚语使用者的地理文化背景。可用于训练意图分类、槽位识别及示例生成模型。 文件详解 主数据集文件 文件名称:NLUCat_dataset.json 文件格式:JSON...
    packageimg
  • SDG8_Based_日语流行文化促进语言学习与经济赋能问卷数据

    2026年1月28日 30 2 1

    数据集概述 本数据集是为会议论文“Leveraging Japanese Pop Culture to Catalyze Language Learning and Economic Empowerment: A Pathway to Achieving SDG...
    packageimg
  • Pama_Nyungan_Based_颜色词汇修订数据_语言学分析

    2026年1月27日 30 97 6

    数据集概述 本数据集为修订后的Pama-Nyungan语言颜色词汇表,包含约187种Pama-Nyungan语言的基础颜色术语。数据基于PNAS发表的Word表格修订,补充了Nash 2017年研究的修正内容,为语言学领域研究颜色术语演变提供结构化数据支持。 文件详解 文件名称:amended PNy colour vocabs...
    packageimg
  • 附录_42种语言定量定性分析结果_xlsx_多语言样本分析结果数据

    2026年1月27日 30 40 23

    数据集概述 本数据集展示基于42种语言样本的定量与定性分析结果,包含一份Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据,无子目录结构,聚焦多语言分析领域的核心结果呈现。 文件详解 文件名称:Appendix2b_Results_of_quantitative_qualitative_analysis_42_languages.xlsx...
    packageimg
  • Jordanian_Arabic_Adjectives_情感规范数据

    2026年1月26日 30 178 100

    数据集概述 本数据集包含98个约旦阿拉伯语形容词在效价(Valence)、唤醒度(Arousal)和熟悉度(Familiarity)三个维度的规范数据,为阿拉伯语情感计算和语言学研究提供结构化参考。数据集仅包含一个文档文件。 文件详解 文件名称:Datafinal.docx 文件格式:DOCX...
    packageimg
  • CLDF_Derived_声音象征类型学语义与语音特征数据集2020

    2026年1月23日 30 166 113

    数据集概述 本数据集是基于Johansson等人2020年发表的《声音象征类型学》研究生成的CLDF格式数据集,核心内容为通过语义和语音特征定义宏观概念的声音象征类型学研究数据,包含一个压缩文件,便于语言类型学领域的研究与分析。 文件详解 压缩文件 文件名称:lexibank/johanssonsoundsymbolic-v1.3.zip...
    packageimg
  • CLDF_Dataset_Kusunda语言250个概念词表数据2020

    2026年1月22日 30 5 3

    数据集概述 本数据集为CLDF格式,源自Aaley和Bodt于2020年发布的《New Kusunda data: A list of 250 concepts》,包含Kusunda语言的250个概念词表信息,是语言比较研究的标准化数据资源,仅含一个压缩文件。 文件详解 文件名称:lexibank/aaleykusunda-v2.1.zip...
    packageimg
  • KDPII_Based_韩语对话文本PII去标识化数据集_Revised

    2026年1月21日 30 65 62

    数据集概述 本数据集为KDPII数据集,是针对韩语对话文本的个人可识别信息(PII)去标识化任务构建的新型数据集。包含丰富的韩语对话文本,整合了大量韩语PII实例,旨在解决韩语隐私保护领域语言模型训练资源不足的问题,为韩语PII去标识化技术研发提供支撑。 文件详解 文件名称:PII_dataset_V3.json 文件格式:JSON...
    packageimg
  • JOST_专业翻译杂志_非二元性别出柜报道中性别公平语言策略的翻译研究数据

    2026年1月21日 30 159 82

    数据集概述 本数据集为论文“Translating Non-Binary Coming-Out Reports: Gender-Fair Language Strategies and Use in News...
    packageimg
  • Climate_Change_Based_社交媒体气候变化舆论AI分析数据

    2026年1月21日 30 114 53

    数据集概述 本数据集围绕气候变化与社交媒体舆论主题,通过AI技术分析土耳其语和英语推文,核心文件为climate.xlsx,为研究社交媒体中公众对气候变化的态度提供结构化数据支持。 文件详解 文件名称:climate.xlsx 文件格式:XLSX...
    packageimg