-
俄罗斯与乌兹别克民间自然现象谜语数据集
数据集概述 该数据集包含俄罗斯与乌兹别克民间文化中关于自然现象的谜语资料,以单一PDF文档形式呈现,为研究不同文化背景下自然现象相关民间文学的特征提供基础数据支持。 文件详解 文件名称: Тумонбаева Мира Жээнбаевна.pdf 文件格式: PDF 内容说明: 文档包含俄罗斯与乌兹别克民间文化中以自然现象为主题的谜语内容 适用场景...
-
FT48_Tauber_4_9键次中音巴松管测量与照片数据集
数据集概述 该数据集包含FT48 Tauber(4)9键次中音巴松管的详细外部、内部测量数据及照片,共13个文件,涵盖基础信息、各部件测量文档及图片资料,为乐器研究提供数据支持。 文件详解 PDF文档文件(共7个): FT48 Basic_info_sheet_Tauber4_9key_tenoroon.pdf:基础信息表 FT48_Wing...
-
荷兰奈梅亨_伦特地区史前刻符陶器数据集
数据集概述 本数据集包含荷兰奈梅亨-伦特地区出土的一件早铁器时代(公元前800-500年)微型刻符陶器的相关资料,包括陶器刻符的图像及3D模型文件,为研究欧洲北部早期文字符号起源提供实证数据。 文件详解...
-
AHXIOM爱之想象注意接受与认可理论文档
数据集概述 本数据集为关于AHXIOM理论框架的文档,核心内容围绕想象、注意、接受与认可如何构成“爱”的概念展开,介绍了AHXIOM中的三元、四元、五元等辩证结构及其与主体选择的关系。 文件详解 文件名称: ∅ AHXIOM Imagining and Attention and Accepting and Approving as-...
-
儿童语言习得错误理论实验研究数据集
数据集概述 该数据集基于一项关于语言习得错误理论的干预研究,探究儿童与成人在预测性输入与意外性输入下的句法结构学习差异,验证错误理论核心假设,即意外输入能否提升语言表征的持久变化率,为语言习得机制研究提供实验数据支持。 文件详解 该数据集包含9个文件,具体说明如下: - 数据文件: -...
-
DIG4EL通用智能体116种语言规范词序测试结果数据集
数据集概述 该数据集包含DIG4EL通用智能体(GA)针对116种语言规范词序的测试结果。智能体基于7个可自动观测的词序参数,推断8个未知词序参数,采用留一法(Leave-One-Out)测试,每种语言独立测试11个轮次(epochs),数据为软件输出的原始真值表。 文件详解 文件名称: truth_tables.zip 文件格式:...
-
藏语古典词性标注词汇表
数据集概述 该数据集是为自然语言处理(NLP)任务构建的藏语古典词性标注词汇表。数据来源于动词词干数字化版本及人工标注的训练数据,部分词汇通过手动添加以优化基于规则的词性标注,适用于藏语古典文本的词性分析与处理。 文件详解 文件名称: Lexicons.zip 文件格式: ZIP压缩包 内容说明:...
-
基于Sagart等人2019年汉藏语词汇同源词数据库的CLDF数据集
数据集概述 该数据集是基于Sagart等人2019年发布的"汉藏语词汇同源词数据库"转换而来的CLDF格式数据集,主要用于汉藏语系语言的词汇同源关系研究,为语言比较和历史语言学分析提供结构化数据支持。 文件详解 文件名称: lexibank/sagartst-v2.1.zip 文件格式: ZIP (.zip) 文件内容:...
-
巴布纳玛_测量单位翻译对比分析数据集
数据集概述 本数据集聚焦于《巴布纳玛》中测量单位翻译的对比分析,包含相关研究的PDF文档,为理解该文本中测量单位翻译的差异与特点提供资料支持。 文件详解 文件名称: Sayyora Shodmonova.pdf 文件格式: PDF 文件内容: 该文档为《巴布纳玛》测量单位翻译对比分析的研究文件,具体内容需查看文档详情 适用场景 翻译学研究:...
-
否定协调词数据库参考文献
数据集概述 本数据集为否定协调词数据库的参考文献列表,包含一份覆盖二百五十种语言样本的参考文献文档,为语言学领域中否定协调词相关研究提供文献支持。 文件详解 文件名称:References_to_full_250-languge_sample.pdf 文件格式:PDF (.pdf)...
-
Barayin_Lexicon_Based_2021_03_17_多语言词汇分析数据
数据集概述 本数据集为Barayin语词汇表,包含约一千九百个词汇,主要来自Jalkiya方言,偶含Giliya方言词汇及法语、阿拉伯语借词。词汇提供英语、法语、乍得阿拉伯语释义,数据未核查一致性,释义未必覆盖完整语义范围。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Barayin lexicon...
-
GramAdapt跨语言社会接触数据集2023
数据集概述 该数据集为GramAdapt跨语言社会接触数据集,由多位研究者合作构建,包含跨语言社会接触相关数据,版本为1.0.0,存储于Zenodo平台,为跨语言社会接触领域研究提供数据支持。 文件详解 文件名称:gramadapt-v1.2.zip 文件格式:ZIP压缩包(.zip)...
-
法语中熟语单位的表达
数据集概述 该数据集包含一份关于法语中熟语单位表达的文档,聚焦熟语单位在法语中的使用特征与表现形式,为相关语言研究提供资料支持。 文件详解 文件名称:Ikromova Lola Boltayevna.pdf 文件格式:PDF 内容说明:该文档围绕法语熟语单位的表达展开,具体内容需通过阅读文档获取,未提供字段映射信息。 适用场景...
-
CHILDES_decision_Based_儿童语言决策行为分析完整数据
数据集概述 该数据集包含一个名为zenodo.zip的压缩文件,未提供具体内容描述,推测与CHILDES相关的决策类数据相关,具体内容需解压后查看。 文件详解 文件名称: zenodo.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内具体文件及字段信息未提供,需解压后获取详细内容 适用场景...
-
加泰罗尼亚通用网络爬取语料库2020
数据集概述 该数据集是加泰罗尼亚语文本语料库的子库,通过爬取2020年7月最受欢迎的500个.cat和.ad域名获取,包含约四亿三千五百万个词、一千九百四十五万余句和一百零一万六千余篇文档,文档以单行新行分隔,用于语言学或自然语言处理研究。 文件详解 文件名称: catalan_general_crawling.zip 文件格式: ZIP(.zip)...
-
WPm扩展中的填充词与格研究
数据集概述 该数据集包含一份PDF文档,主题围绕WPm扩展中的填充词与格现象展开,为相关语言学研究提供文献资料支持。 文件详解 文件名称: Sh.T.Akramov.pdf 文件格式: PDF (.pdf) 文件内容: 主题为WPm扩展中的填充词与格研究的文档,具体内容需查阅PDF文件获取 适用场景 语言学研究:...
-
欧洲右翼及极右翼政治移民推文语料库2011_2022
数据集概述 本数据集是多语言移民主题推文语料库,聚焦2011-2022年欧洲英、法两国右翼及极右翼政治人物与政党的移民相关言论,含法、英两个子语料库,共一万八千二百三十三条推文、五十三万三千一百九十八词,为研究数字移民话语提供支持。 文件详解 该数据集包含多个CSV和ZIP格式文件,具体说明如下: - 法国子语料库文件(FR-R-MIGR-...
-
塞尔维亚小说语料库2021年4月版
数据集概述 该数据集是2021年4月发布的塞尔维亚小说语料库(ELTeC-srp),包含90部以一级编码标注的小说文本,属于欧洲文学文本集合(ELTeC)的一部分,由COST Action项目推动构建。 文件详解 README.md(Markdown格式):包含语料库版本信息、发布说明、DOI引用链接及项目背景介绍,帮助用户理解数据集的来源与使用规范。...
-
IN02031图拉钦托勒铭文翻译数据集
数据集概述 本数据集包含IN02031图拉钦托勒铭文(位于巴德冈)的翻译文件,提供了铭文内容的两种格式文档,为研究该铭文的文字内容及历史背景提供直接数据支持。 文件详解 文件名称:IN02031 LVII Tulacheñtol (Bhadgaon).pdf 文件格式:PDF 内容说明:包含图拉钦托勒铭文(巴德冈)的翻译内容,以便携式文档格式存储...
-
宾夕法尼亚德语词表_词形还原与词性标注
数据集概述 该数据集包含ENDE语料库中宾夕法尼亚德语部分的词表,涵盖1761个词元及其对应的2704个词形,已完成词形还原和词性标注,为宾夕法尼亚德语的语言分析提供基础数据。 文件详解 词表数据文件: 文件名称:ENDE-corpus POS-annotated PDC lexicon.tsv 文件格式:TSV(.tsv)...



