-
NewsEye_READ_AS_19世纪芬兰报纸训练数据集
2025年12月24日 30 90 23
数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
-
多语言社区语言趋同研究补充材料_马诺语与克佩勒语反身标记案例
2025年12月23日 30 199 89
数据集概述 该数据集为语言学研究论文《多语言社区使用的语言是否趋同?以马诺语和克佩勒语反身标记为例》的补充材料,包含支撑研究的原始数据与说明文档,为语言趋同现象研究提供实证数据支持。 文件详解 文件名称:data_0405.xlsx,文件格式:XLSX 字段映射:未提供具体字段信息,推测包含马诺语与克佩勒语反身标记的原始语料数据或统计分析数据...
-
多语言广告文本中的成语转换研究文档
2025年12月23日 30 23 12
数据集概述 本数据集包含一份PDF文档,主题为突厥语族语言广告文本中的成语转换研究,聚焦于广告语境下成语的使用与变形分析,为相关语言与广告学研究提供参考资料。 文件详解 文件名称: Abdisamatov Ahrorjon Jalolxon oʻgʻli..pdf 文件格式: PDF 文件内容:...
-
语言与文化关系研究文档
2025年12月23日 30 49 5
数据集概述 该数据集包含一份关于语言与文化关系的文档,聚焦于探讨二者之间的关联。文档以PDF格式呈现,为相关领域的理论研究或文献分析提供参考资料。 文件详解 文件名称: Abdieva Vazira Ashurovna.pdf 文件格式: PDF (.pdf) 内容说明:...
-
伊比利亚_罗曼语对意大利_罗曼语方言及撒丁语历史影响文献目录
2025年12月22日 30 149 66
数据集概述 该数据集是一份围绕伊比利亚-罗曼语对意大利-罗曼语方言(那不勒斯语、西西里语)及撒丁语历史影响主题的文献目录。内容涵盖背景介绍、基础现象提及、相关影响现象讨论及特定现象深度研究等,作者计划定期更新,欢迎建议补充。 文件详解 文件名称:...
-
南岛语系语言关系模型支持数据集
2025年12月22日 30 85 12
数据集概述 本数据集是Smith《晚期马来-波利尼西亚语:南岛语系语言关系新模型》一文的配套表格数据,用于支持文章中的分析。原计划作为附录置于文末,为提升文章可读性移至此处。 文件详解 文件名称: LMP.appendices.pdf 文件格式: PDF (.pdf) 内容描述: 包含原计划作为文章附录的表格数据及相关说明 文件名称:...
-
古缅甸石刻铭文结构化语料库
2025年12月22日 30 171 95
数据集概述 本数据集为古缅甸石刻铭文的结构化语料库,主要基于《ရှေးဟောင်းမြန်မာကျောက်စာများ Ancient Burmese Inscriptions》数据集,并补充了Thein Tun与Tilman Frasch的材料,包含多卷语料压缩包、说明文档及转写系统文件。 文件详解 语料压缩包(共8个,.zip格式):...
-
巴斯克历史文本语料库
2025年12月21日 30 193 139
数据集概述 该数据集是一个巴斯克历史文本语料库,包含为某项研究分析的历史文本,按文本体裁和方言分类,并附来源参考信息,为研究巴斯克语言历史与文化提供数据支持。 文件详解 文件名称: Corpus_of_historic_Basque_texts.pdf 文件格式: PDF (.pdf) 文件内容:...
-
乌拉尔语系地理数据库
2025年12月21日 30 119 78
数据集概述 该数据集包含乌拉尔语系过去与当前分布的原始数字空间数据集及最终地图。数据由多机构资助的跨学科团队联合乌拉尔语专家收集,以矢量数据可视化语言分布,支持空间语言学及多学科研究,直观呈现乌拉尔语系及其方言的研究现状。 文件详解 文件名称:Geographical database of the Uralic languages.zip...
-
喀麦隆Lower_Fungom地区Mufu语言225词词汇表
2025年12月20日 30 24 9
数据集概述 该数据集为喀麦隆Lower Fungom地区Mufu语言的225词词汇表。Mufu属于Yemne-Kimbi语族,是一种声调语言,其名词前缀已演变为定语环境下的一致标记。数据收集自两位顾问,存在个体词汇差异,可能与社会语言学背景相关。 文件详解...
-
Zenodo_Komnzo_Text_Corpus_Based_202406语言语料库完整数据
2025年12月20日 30 156 2
数据集概述 本数据集包含最新版本的Komnzo文本语料库压缩文件,由Christian Döhler为其博士语言记录项目录制,记录了新几内亚南部的Komnzo语言相关材料。 文件详解 文件名称: Komnzo-2024-06.zip 文件格式: ZIP(压缩文件) 内容说明:...
-
科学文献中扭曲短语现象补充材料数据集
2025年12月20日 30 28 15
数据集概述 本数据集是预印本论文《Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established...
-
数字时代变异社会语言学在线交流分析挑战数据集
2025年12月20日 30 87 82
数据集概述 本数据集为一篇学术文章,探讨数字时代将变异社会语言学应用于在线交流分析的挑战与机遇,分析传统方法如何适应数字平台独特语言特征,涉及数据收集、身份流动性及数字语言对变异的影响等内容。 文件详解 文件名称: 1-112-116-Yuldashev Doniyor.pdf 文件格式: PDF (.pdf) 文件内容:...
-
IN02004昌古纳拉扬石柱碑刻基座铭文译文
2025年12月20日 30 160 53
数据集概述 该数据集包含IN02004昌古纳拉扬石柱碑刻基座铭文的译文资料,以文档形式呈现,为研究该历史铭文内容提供直接的文本参考。 文件详解 文件名称:IN02004 Changu Narayana Base of Pillar Inscription (translation).docx 文件格式:DOCX...
-
阿拉瓦克语言多样性CLDF数据集2019
2025年12月20日 30 61 0
数据集概述 本数据集为基于Chacon等人2019年研究的CLDF格式数据,内容围绕20世纪50年代录音资料中的阿拉瓦克语言多样性展开,聚焦里奥内格罗上游地区的语言记录与分析。 文件详解 文件名称: lexibank/chaconbaniwa-v2.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
法语语言中元音的历史与语音学分析数据集
2025年12月19日 30 8 2
数据集概述 本数据集包含一份关于法语语言中元音的历史演变与语音学特征分析的文档,聚焦于法语元音系统的历史发展脉络及语音学层面的研究内容。 文件详解 文件名称:Mamasoliyeva Gulchexra Abduxalilovna.pdf 文件格式:PDF (.pdf) 内容说明:该文档围绕法语元音的历史与语音学分析展开,具体内容需查阅文档正文。...
-
社会网络对语言变化的影响_变异主义视角
2025年12月19日 30 134 66
数据集概述 本数据集包含一篇学术论文,从变异主义社会语言学视角探究社会网络对语言变化的影响,分析社会网络结构、关系强度等因素如何推动语言特征的扩散与演变。 文件详解 文件名称:Mamatova Feruza Makhammadovna.pdf 文件格式:PDF(.pdf)...
-
早期英语书信扩展样本库第二部分数据集2022
2025年12月19日 30 103 68
数据集概述 该数据集是早期英语书信语料库(CEEC-400)18世纪部分的第二个公开版本,属于早期英语书信扩展样本库(CEECES)的一部分,包含书信元数据及相关说明文档,为研究18世纪英语书信语言特征提供数据支持。 文件详解 Key to metadata codes in CEECES.pdf:PDF格式,提供CEECES元数据编码的说明文档...
-
尼泊尔部分语言词汇表数据集1973
2025年12月19日 30 82 20
数据集概述 该数据集是基于Hale 1973年《尼泊尔部分语言词汇表》衍生的CLDF格式数据集,包含尼泊尔特定语言的词汇信息,为语言研究提供结构化数据支持。 文件详解 文件名称:lexibank/halenepal-v4.0.zip 文件格式:ZIP压缩包(.zip)...
-
基于民间词源的偶发词及其方法学应用数据集
2025年12月18日 30 57 23
数据集概述 本数据集围绕基于民间词源的偶发词及其方法学应用展开,包含一份相关的PDF文档,为研究偶发词的形成机制与方法学应用提供资料支持。 文件详解 文件名称: Sevаrа Mаhmudоvа.pdf 文件格式: PDF 内容概述: 文档围绕基于民间词源的偶发词及其方法学应用主题展开,具体内容需查阅文档获取 适用场景 语言学研究:...



