-
英语与汉语中_I_动词_信念结构的韵律语用映射数据集
数据集概述 该数据集包含英语与汉语中[I+动词]信念结构的韵律语用映射相关原始数据,用于开展感知测试研究,为分析两种语言中该结构的韵律特征与语用功能关联提供基础数据。 文件详解 文件名称: RawData.sav 文件格式: SPSS数据格式(.sav) 内容说明:...
-
韩语指代形式与助词选择参考数据
数据集概述 本数据集为韩语指代形式与助词选择的参考数据,提供相关语言现象的研究基础数据支持。 文件详解 文件名称: Hwang_data_for_reference_form_particle_choice_in_Korean.xlsx 文件格式: XLSX(Excel表格) 内容说明:...
-
Reddit跨主题作者身份验证语料库
数据集概述 该数据集包含2010至2016年间1000名Reddit用户的评论内容,每个问题包含1篇未知文档和4篇已知文档(每篇约7KB),文档由同一子版块评论聚合而成,且问题内文档子版块不重叠,覆盖1388个不同主题,格式与PAN作者身份识别语料库一致。 文件详解 文件名称: Reddit_Cross-Topic-AV-...
-
推特对话中的讽刺语料库
数据集概述 该数据集为包含两部分作者-受众推特对话的语料库,附带人工标注的讽刺极性标签,可用于研究推特对话中的讽刺识别,以CSV格式存储核心数据。 文件详解 文件名称:sarcasm_corpus.csv 文件格式:CSV 字段映射: author:目标推文的ID编号 audience:对话中另一推文的ID编号...
-
维基百科双语单标签语料库
数据集概述 该数据集是一个西班牙语-英语双语单标签语料库,包含英文文档3019篇、西班牙文文档832篇,覆盖文化艺术、地理与地点、数学与逻辑三类主题,可用于自然语言处理相关研究。 文件详解 文件名称: wikipedia_corpus.zip 文件格式: ZIP (.zip) 内容说明: 可能包含语料库的核心数据文件,如文本数据及分类标签等 文件名称:...
-
CATCH孟加拉语翻译支持文档集
数据集概述 该数据集为Chedoke-McMaster残障儿童态度量表(CATCH)的英文问卷翻译成孟加拉语版本的支持文档集,包含正向翻译、反向翻译、合成文档及原始量表等文件。 文件详解 文件名称:CATCH Bangla/Forward translation 1.docx、CATCH Bangla/Forward translation...
-
希腊语与英语PAY语义结构及意象图式保留历史比较分析数据集
数据集概述 本数据集围绕希腊语与英语“PAY”相关语义的历史比较分析展开,包含英语“pay”约340个实例及古希腊语“pleroo”约4000个实例,通过编码记录其语义类型、句法成分及行为特征,为探究语义结构与意象图式保留提供数据支持。 文件详解 数据文件(共8个CSV格式文件): 英语数据文件:PAY_13th_14th_15th...
-
波利尼西亚语境下哲学实践分析_转型与变革主题案例
数据集概述 该数据集为波利尼西亚语境下哲学实践的分析案例,围绕转型与变革主题展开,包含法国波利尼西亚大学博士论文相关的哲学讨论转录文本及半结构化访谈内容,涉及学校场景的哲学讨论与事后对参与实验母亲的访谈。 文件详解 文件名称: Deprez, S. (2022) Corpus du thème de la transformation, du...
-
Dataset_4T_9_σ_200_翻译后修饰系统稳健性与参数地理解决方案文件_第9部分
数据集概述 该数据集包含σ=200条件下Paramotopy运行的所有正确解决方案文件,基于计算10倍可见性比率的采样参数点生成,用于研究翻译后修饰系统的稳健性与参数地理特征,支持相关生物系统动态的分析。 文件详解 目录结构:数据集包含1个目录,目录深度为1,目录名称为Dataset 4T.9 Solutions files, sigma = 200,...
-
二战后泰英谈判补充文件集
数据集概述 本数据集是二战后泰国与英国谈判研究的补充文件汇编,包含来自英国、美国和泰国的档案记录,旨在为后续研究者提供原始文献参考。其中泰国内阁会议纪要以泰文记录,未翻译为英文,研究者可借助翻译工具解读,数据引用需标注指定DOI。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Supplementary Documents...
-
英雄与反英雄特征编码手册
数据集概述 本数据集为英雄与反英雄特征编码手册,旨在通过理论支持统一研究者间的判定标准,用于识别总统候选人语料中英雄与反英雄的编码,实现量化与比较分析。 文件详解 数据集包含一个PDF格式的编码手册文件,具体如下: - 文件名称: Codebook of hero and antihero characteristics/Libro de...
-
非裔流散群体的音乐声音与政治文化维度对黑人学者民族音乐学研究的相关性
数据集概述 本数据集为一项民族音乐学研究项目资料,聚焦非裔流散群体的音乐声音维度与政治文化维度,从黑人学者视角探讨其对民族音乐学的相关性,包含研究文档及配套图片。 文件详解 文档文件: DIMENSÕES SONORO-MUSICAIS E POLÍTICO-CULTURAIS DA AFRODIÁSPORA BRASILEIRA NA...
-
学术写作中短语动词使用跨语料库研究数据集
数据集概述 该数据集围绕母语(L1)与非母语(L2)英语学者学术写作中的短语动词使用展开跨语料库研究,包含从BDC和TDC语料库中提取的所有短语动词及其定义和使用频率,为分析不同语言背景学者的学术写作语言特征提供数据支持。 文件详解 文件名称: ALL PVS (with definitions).xlsx 文件格式: .xlsx(Excel表格)...
-
尼日利亚Nsukka大学本科生性话语俚语数据集
数据集概述 该数据集收录了尼日利亚Nsukka大学本科生使用的性话语俚语,核心内容为学生通过使用文雅术语掩盖性相关词汇粗俗性的表达方式,为研究特定群体性话语的语言特征提供数据支持。 文件详解 文件名称: Sex Discourse Slang/Data for Sex Discourse Slang.docx 文件格式: DOCX (.docx)...
-
小鼠温度饲养条件描述语句训练数据集
数据集概述 该数据集是用于描述小鼠温度饲养条件的语句训练集,包含四百八十条相关语句,为自然语言处理任务提供训练数据支持。 文件详解 文件名称: relevant_temperature_480_sentences_full_lstm.txt 文件格式: TXT 内容说明: 包含四百八十条与小鼠温度饲养条件相关的语句,每行以编号开头,后跟具体描述文本...
-
阿拉伯语_英语双语者皮博迪词汇测试主观频率估计数据集
数据集概述 本数据集包含阿拉伯语-英语双语者对皮博迪词汇测试(PPVT)单词的主观频率估计数据,涉及词汇的语言形式、主观频率评分、词汇特征等信息,为双语词汇认知及心理语言学研究提供数据支持。 文件详解 文件名称: DATA_SET.sav 文件格式: SAV(SPSS数据格式) 字段映射:...
-
口语语篇说服策略数据分析
数据集概述 本数据集围绕口语语篇中的说服策略展开分析,核心内容为丹泽尔·华盛顿于2015年5月9日在迪拉德大学毕业典礼上发表的《Put God First》和《Fall Forward》两篇演讲的语料库,包含18段研究分析用的摘录内容。 文件详解 文件名称: Corpus.pdf 文件格式: PDF 内容说明:...
-
MIOH_DS干预过程评估访谈转录数据集
数据集概述 本数据集包含MIOH-DS干预项目过程评估的焦点小组访谈转录文本,共3份文档,分别对应Campbelltown、Fairfield和Nepean三个地区的助产士访谈内容,为了解干预实施情况与相关群体反馈提供质性数据支持。 文件详解 该数据集由3份访谈转录文档组成,具体说明如下: - 文件列表: -...
-
博士学位论文中的短语动词_基于语料库的母语与二语学术写作比较数据集
数据集概述 该数据集围绕博士学位论文中的短语动词展开,通过语料库方法对比母语(L1)与二语(L2)学术写作者的使用差异,包含两类写作者使用的短语动词类型、定义、句法分类及示例语境等核心信息。 文件详解 文件名称:PV Types.xlsx 文件格式:Excel(.xlsx)...
-
英语比喻性短语理解的母语与非母语对比数据集
数据集概述 该数据集包含英语母语者、通用非母语者(多种母语背景)及中文母语者对英语比喻性短语的熟悉度、透明度、意义及可分解性评分数据,短语类型涵盖英语习语、新隐喻、陌生习语(译自德/保加利亚语)及译自中文的习语,非母语者数据含语言学习背景、英语使用及词汇水平等人口统计信息。 文件详解 文件名称: Carrol-Littlemore-Dowens-...



