-
La_Pola_Siero_感知问卷问题1数据
2026年2月1日 30 99 79
数据集概述 本数据集属于La Pola Siero方言语料库的一部分,包含感知问卷的第一个问题内容。数据集仅含一个文件,无目录层级划分,未进行训练测试、数据标签或原始/处理数据的拆分,主要用于语言学领域对该方言的感知研究。 文件详解 文件名称:Pregunta 1 del cuestionario perceptivo.docx 文件格式:DOCX...
-
La_Pola_Siero_阿斯图里亚斯地图第4问口语语料数据
2026年1月29日 30 65 11
数据集概述 本数据集包含与“阿斯图里亚斯地图:第4问”相关的La Pola Siero地区口语语料,核心为1份docx格式文档,未区分训练/测试、数据/标签或原始/处理数据,无额外目录层级,文件类型单一。 文件详解 文件名称:Mapa de Asturias.Pregunta4.docx 文件格式:docx...
-
La_Pola_Siero_Based_阿斯图里亚斯地图第五问口语语料数据
2026年1月21日 30 48 2
数据集概述 本数据集为关于阿斯图里亚斯地图第五问的口语语料数据,来自La Pola Siero地区的口语语料库。数据集包含1个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,主要文件类型为DOCX格式。 文件详解 文件名称:Mapa de Asturias.Pregunta5.docx 文件格式:DOCX...
-
Hypocoristic_Truncation_Sardinian_语言学研究数据集
2026年1月18日 30 38 18
数据集概述 本数据集是用于语言学研究的撒丁岛昵称截断数据,对应论文Cabré, Teresa等人的相关研究。数据聚焦撒丁岛语言中昵称的截断现象,为分析该语言现象提供结构化资料,仅包含一个文件。 文件详解 文件名称:dataset_Hypocoristic_truncation_in_Sardinian.xlsx 文件格式:XLSX...
-
英语作为连接不同文化的语言数据集
2025年12月24日 30 122 37
数据集概述 本数据集包含一份关于“英语作为连接不同文化的语言”主题的文档,以PDF格式呈现,聚焦于英语在跨文化交流中的桥梁作用,为相关语言文化研究提供参考资料。 文件详解 文件名称: Ergasheva Malohat Yo’ldosh qizi .pdf 文件格式: PDF (.pdf) 文件内容:...
-
KPAAMCAM_NTs_FANG_Based_225词表语言特征分析完整数据
2025年12月23日 30 196 13
数据集概述 该数据集为喀麦隆西北部Lower Fungom地区Fang语的225词表,Fang语属Yemne-Kimbi语族,具声调、名词前缀及动词词缀变化,含两位顾问提供的词汇变体数据,变体与社会语言学特征差异相关。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: -...
-
性别特征在语言中的体现
2025年12月22日 30 19 5
数据集概述 该数据集包含一份关于语言中性别特征体现的文档,聚焦于性别相关特征在语言表达中的呈现形式与影响,为语言与性别研究提供基础资料。 文件详解 文件名称: I.A.Egamberdiyeva.pdf 文件格式: PDF (.pdf) 内容说明: 该PDF文档围绕“性别特征在语言中的体现”主题展开,具体内容需通过阅读文档获取。 适用场景...
-
葡萄牙语文本中的性别偏见数据集
2025年12月22日 30 193 55
数据集概述 该数据集包含用于研究葡萄牙语文本中性别偏见的相关数据,包括精选的葡萄牙语文学语料库、构建句子模板的词表以及已生成的句子模板文件,为基于掩码语言模型的性别偏见分析提供支持。 文件详解 语料库文件: corpus.zip:压缩文件,包含1804-1998年巴西和欧洲葡萄牙语的592部散文作品,共120万句、1760万词的精选文学语料库...
-
Lower_Fungom_Ngun_Based_喀麦隆Ngun语言词汇资源数据集
2025年12月22日 30 10 7
数据集概述 该数据集为Ngun语言的225词表,Ngun是蒙巴姆语的一种变体,属于也门-金比语族,使用于喀麦隆西北部Menchum省Fungom分区的Lower Fungom地区,语言具有声调及名词前缀特征,记录了两位顾问间的词汇变异。 文件详解 文件名称:...
-
突尼斯阿拉伯语拉丁转写语料库2017_2021
2025年12月21日 30 59 25
数据集概述 该数据集是2017-2021年构建的突尼斯阿拉伯语(ISO 693-3: aeb)拉丁转写(Arabizi)文本资源,通过网络爬取Facebook公开页面消息,经人工筛选保留纯突尼斯阿拉伯语拉丁转写内容,无标注或调整,用于解决突尼斯阿拉伯语拉丁转写NLP数据库缺失问题。 文件详解 文本文件(.txt格式,共13个):...
-
在线英语会话的社会语言学研究论文
2025年12月20日 30 104 21
数据集概述 本数据集包含一篇关于在线英语会话社会语言学方面的研究论文,聚焦于该主题的学术探讨,为相关领域研究提供文献参考。 文件详解 文件名称: Akhmedova Sarvinoz Hikmatovna.pdf 文件格式: PDF (.pdf) 文件内容:...
-
英语与乌兹别克人宗教价值观及其语言表达数据集
2025年12月19日 30 4 0
数据集概述 本数据集围绕英语与乌兹别克人群体的宗教价值观及其在语言中的表达展开,包含一份PDF格式的相关文档,为研究不同文化群体宗教价值观的语言呈现差异提供资料支持。 文件详解 文件名称: Djumaeva Nozima Djurabaevna1.pdf 文件格式: PDF(.pdf) 内容说明:...
-
早期英语书信扩展样本库第二部分数据集2022
2025年12月19日 30 8 4
数据集概述 该数据集是早期英语书信语料库(CEEC-400)18世纪部分的第二个公开版本,属于早期英语书信扩展样本库(CEECES)的一部分,包含书信元数据及相关说明文档,为研究18世纪英语书信语言特征提供数据支持。 文件详解 Key to metadata codes in CEECES.pdf:PDF格式,提供CEECES元数据编码的说明文档...
-
数字通信影响下语言规范变化数据集
2025年12月16日 30 129 10
数据集概述 本数据集围绕数字通信对语言规范变化的影响展开,包含一份PDF格式的相关研究文档,为探究该主题提供资料支持。 文件详解 文件名称:Husenova Dilfuza Uktamovna.pdf 文件格式:PDF(.pdf) 内容说明:文档围绕数字通信影响下语言规范变化的主题展开,具体内容需通过阅读文档获取 适用场景...
-
穆罕默德开罗加姆拉录音描述与评论的阿拉伯语及法语转录文本20130530
2025年12月14日 30 191 46
数据集概述 该数据集是“耳朵里的麦克风”双耳实验的一部分,包含2013年5月30日埃及开罗加姆拉地区参与者穆罕默德对自身录制的城市声音路线的描述与评论,提供阿拉伯语原文及法语译文的转录文本。 文件详解 文件名称: Arabic transcript of description and comments Mohammed...
-
圣维森特岛佛得角克里奥尔语数据集2019
2025年12月13日 30 193 173
数据集概述 本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。 文件详解 该数据集包含11个文件,按类型分类说明如下: - PDF文档类(共4个): -...
-
语言帝国主义研究文献
2025年12月8日 30 64 26
数据集概述 本数据集包含一篇关于语言帝国主义的研究文献,探讨语言层面体现的帝国主义微妙线索与影响因素,分析其如何促成通用语(lingua franca)的形成与传播。 文件详解 文件名称: Sultonova Gulbaxor Murtazaxonovna.pdf 文件格式: PDF 内容说明:...
-
世界语言景观中的国家层面语言学研究对象
2025年12月6日 30 144 110
数据集概述 本数据集聚焦于“世界语言景观中的国家层面”这一语言学研究对象,通过单一PDF文档呈现相关研究内容,为语言学领域关于语言景观的国家维度分析提供资料支持。 文件详解 文件名称: Akramova Guljakhon.pdf 文件格式: PDF (.pdf) 文件内容:...
-
早期英语书信扩展标注语料库抽样数据集
2025年12月4日 30 43 6
数据集概述 本数据集是早期英语书信语料库(CEEC-400)18世纪部分的第三个公开版本,是未出版的《早期英语书信扩展标注语料库》(TCEECE)的抽样提取内容,包含书信元数据、编码说明文档及语料库文件,为早期英语语言研究提供标注语料资源。 文件详解 文件名称:CEECES1-metadata.txt 文件格式:TXT...



