-
Hewramî_Based语言主语一致标记数据_已接收
2026年1月30日 30 195 99
数据集概述 本数据集是论文《Subject agreement emerges from topic continuity, not topic shift. Corpus-based evidence from...
-
xflr6_Source_人称合并词类型学评估补充材料数据
2026年1月30日 30 117 1
数据集概述 本数据集是论文《Assessing the typology of person portmanteaus》的补充材料,包含1个压缩文件,用于支撑人称合并词类型学的研究评估,为语言学领域相关分析提供辅助数据支持。 文件详解 文件名称:xflr6/portmanteaus-v1.0.zip 文件格式:ZIP...
-
Saami_Based_萨米语敏感动词派生表附录数据2022
2026年1月29日 30 144 47
数据集概述 本数据集是论文附录,包含4个文件,展示不同萨米语词典来源中记录的敏感动词派生词。数据以表格/列表形式呈现,给出动词派生的基础词(按对应语言/来源或北萨米语标注)及芬兰语简短释义。数据支持萨米语形态学研究,具体来源信息参见关联论文。 文件详解 文档文件(Document files) 文件名称:Liite4-4tav-...
-
Source_Concepts_Based非洲语言源概念研究数据
2026年1月28日 30 59 24
数据集概述 本数据集是论文“Mouths, tongues, and ears: Source concepts for 'language' across Africa”配套的Excel表格数据,包含非洲语言中“语言”相关源概念的研究数据,共1个文件,用于支撑非洲语言概念系统的分析研究。 文件详解...
-
AppendixA_Based_人称代词跨语言变异信息论研究数据
2026年1月28日 30 107 69
数据集概述 本数据集为论文附录A内容,包含来自语法资料的人称代词系统数据,用于支持人称代词跨语言变异的信息论研究,仅含一个文件。 文件详解 文件名称:appendixA.xlsx 文件格式:XLSX 字段映射介绍:文件为附录A的表格数据,具体字段未提供预览,推测包含与跨语言人称代词系统相关的语法资料内容。 数据来源 论文“They saw it,...
-
SDG8_Based_日语流行文化促进语言学习与经济赋能问卷数据
2026年1月28日 30 40 2
数据集概述 本数据集是为会议论文“Leveraging Japanese Pop Culture to Catalyze Language Learning and Economic Empowerment: A Pathway to Achieving SDG...
-
Enggano_Based_1895年词汇表CLDF标准化数据集
2026年1月27日 30 134 113
数据集概述 本数据集为1895年Enggano词汇表的数字化CLDF格式版本,匹配了Holle List的英文及印尼语释义,包含Enggano词汇的通用正字法、原始转录、音素分割及国际音标转写等信息,适用于濒危语言词汇研究与跨语言比较分析。 文件详解 文件名称:engganolang/holle-list-enggano-1895-2.0.0.zip...
-
Pama_Nyungan_Based_颜色词汇修订数据_语言学分析
2026年1月27日 30 202 95
数据集概述 本数据集为修订后的Pama-Nyungan语言颜色词汇表,包含约187种Pama-Nyungan语言的基础颜色术语。数据基于PNAS发表的Word表格修订,补充了Nash 2017年研究的修正内容,为语言学领域研究颜色术语演变提供结构化数据支持。 文件详解 文件名称:amended PNy colour vocabs...
-
nlp_text_sentence_Based_汉印尼复合句数据集
2026年1月27日 30 192 191
数据集概述 本数据集包含普通话与印尼语的复合句数据,核心内容围绕两种语言的复合句展开,为自然语言处理领域提供研究资源。数据集文件数量为1,无目录结构,主要文件格式为xlsx。 文件详解 文件名称:Data Set of Compound Sentences in Mandarin and Indonesian.xlsx 文件格式:XLSX...
-
附录_42种语言定量定性分析结果_xlsx_多语言样本分析结果数据
2026年1月27日 30 150 46
数据集概述 本数据集展示基于42种语言样本的定量与定性分析结果,包含一份Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据,无子目录结构,聚焦多语言分析领域的核心结果呈现。 文件详解 文件名称:Appendix2b_Results_of_quantitative_qualitative_analysis_42_languages.xlsx...
-
NewsSR_Based_塞尔维亚新冠疫情早期新闻语料库_多格式版
2026年1月27日 30 199 144
数据集概述 本数据集为塞尔维亚主要日报及新闻门户网站在新冠疫情早期(2020年3月至9月)发布的疫情相关新闻文章语料库,含纯文本版及带完整元数据的XML版,还配套有公民元语言评论语料库Covid-NEWS-Comm-SR,另有斯洛文尼亚和克罗地亚的平行版本。 文件详解 压缩文件1: 文件名称:SR xml.zip 文件格式:ZIP...
-
Compound_words_Based_阿拉伯语中文复合词样本数据
2026年1月27日 30 51 1
数据集概述 本数据集包含阿拉伯语与中文复合词相关的样本数据,聚焦两种语言复合词的对比研究场景,为语言学领域的复合词结构、构成规则等分析提供基础样本支持,数据集由单一文件构成。 文件详解 文件名称:Arabic & Chinese samples.xlsx 文件格式:XLSX...
-
CLDF_Derived_声音象征类型学语义与语音特征数据集2020
2026年1月23日 30 171 139
数据集概述 本数据集是基于Johansson等人2020年发表的《声音象征类型学》研究生成的CLDF格式数据集,核心内容为通过语义和语音特征定义宏观概念的声音象征类型学研究数据,包含一个压缩文件,便于语言类型学领域的研究与分析。 文件详解 压缩文件 文件名称:lexibank/johanssonsoundsymbolic-v1.3.zip...
-
JOST_专业翻译杂志_非二元性别出柜报道中性别公平语言策略的翻译研究数据
2026年1月21日 30 5 0
数据集概述 本数据集为论文“Translating Non-Binary Coming-Out Reports: Gender-Fair Language Strategies and Use in News...
-
Mondzish_Based_中国采集词汇录音转录数据库_2012_2015
2026年1月20日 30 79 39
数据集概述 本数据集为Mondzish(Mangish)词汇数据库,包含2012-2015年在中国采集的音频录音转录内容,是单一文件的词汇资源,可用于Mondzish语言的词汇研究与分析。 文件详解 文件名称:Mondzish_lexical_database.xlsx 文件格式:XLSX...
-
Areal_diachronic_Slavic_论元标记时空趋势研究修正数据集
2026年1月20日 30 66 61
数据集概述 本数据集是论文《Areal and diachronic trends in argument flagging across Slavic》的修正版数据库,由多所高校及研究机构合作构建,聚焦斯拉夫语系中论元标记的区域分布与历时演变趋势。数据集包含一个文件,为语言学研究提供结构化的分析基础。 文件详解...
-
NeoBiota_补充材料_入侵物种研究与生态保护文献语言对比分析数据_2019
2026年1月19日 30 55 38
数据集概述 本数据集是论文“Does invasive species research use more militaristic language than other ecology and conservation biology...
-
Assimilation_Directionality_希腊语与德语词典条目数据
2026年1月19日 30 206 159
数据集概述 本数据集包含带有[x]或[c]标记的希腊语与德语词典条目数据,聚焦于同化方向性主题。数据集仅含一个文件,无分层目录结构,未划分训练测试集、数据标签集或原始处理集,主要文件类型为.xlsx。 文件详解 文件名称:directionality of assimilation.data.xlsx 文件格式:XLSX...
-
Multi_CAST_Based_多语言口语文本标注语料库_Mandarin_Version2311
2026年1月4日 30 31 17
数据集概述 本数据集为Multi-CAST多语言口语标注文本语料库的中文部分,由Maria Vollmer于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中。数据以压缩包形式提供,是研究中文口语标注文本的基础语料资源。 文件详解 文件名称:Multi-...
-
Jordanian_Arabic_Based_自闭症儿童所有格代词使用研究数据集
2026年1月15日 30 17 10
数据集概述 本数据集围绕自闭症谱系障碍儿童对约旦阿拉伯语所有格代词的使用展开,包含1份文档文件,用于支持相关语言学研究,为分析自闭症儿童语言特征提供基础数据。 文件详解 文件名称:dataset.docx 文件格式:DOCX 字段映射介绍:未提供文件内容预览,推测包含与自闭症谱系障碍儿童使用约旦阿拉伯语所有格代词相关的研究数据或分析内容。 适用场景...



