找到189个数据集

标签: 语言研究

过滤结果
  • 含人名构成成分的熟语单位中民族文化元素分析

    2025年12月5日   

    数据集概述 本数据集包含一篇以PDF格式呈现的分析文档,核心内容为研究含人名(专有名词)构成成分的熟语单位中所蕴含的民族文化元素,为探索语言与民族文化关联提供资料支持。 文件详解 文件名称:Tursunov Mirzo Makhmudovich.pdf 文件格式:PDF...
    packageimg
  • 儿童语言发展阶段及其问题数据集

    2025年12月4日   

    数据集概述 本数据集围绕儿童语言发展阶段及其相关问题展开,核心内容为儿童语言发展过程中的阶段特征与常见问题分析,为研究儿童语言发展提供参考。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Bozorova.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 构词链与复合词结构分析文档

    2025年12月4日   

    数据集概述 本数据集为一份PDF文档,核心内容围绕构词链(Словообразовательные цепи)及复合词(Композиты - сложения)在构词链结构中的特征展开,提供相关语言分析内容。 文件详解 文件名称:Рамазанова Шоира Рихсибаевна.pdf 文件格式:PDF(.pdf)...
    packageimg
  • CHILDES_decision_Based_儿童语言决策行为分析完整数据

    2025年12月4日   

    数据集概述 该数据集包含一个名为zenodo.zip的压缩文件,未提供具体内容描述,推测与CHILDES相关的决策类数据相关,具体内容需解压后查看。 文件详解 文件名称: zenodo.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内具体文件及字段信息未提供,需解压后获取详细内容 适用场景...
    packageimg
  • 英法同源词时间分析数据集2020

    2025年12月4日   

    数据集概述 该数据集为LREC 2020会议论文配套数据,核心内容围绕英法同源词的时间分析展开,包含论文文档及同源词列表文本文件,为相关语言研究提供数据支持。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: Frossard_etal_2020_dataset-English-French-cognates_LREC.pdf -...
    packageimg
  • 英语与汉语中_I_动词_信念结构的韵律语用映射数据集

    2025年11月28日   

    数据集概述 该数据集包含英语与汉语中[I+动词]信念结构的韵律语用映射相关原始数据,用于开展感知测试研究,为分析两种语言中该结构的韵律特征与语用功能关联提供基础数据。 文件详解 文件名称: RawData.sav 文件格式: SPSS数据格式(.sav) 内容说明:...
    packageimg
  • 阿拉伯语拼写错误平行语料库数据集

    2025年6月4日   

    阿拉伯语拼写错误平行语料库数据集 数据来源:互联网公开数据 标签:阿拉伯语,拼写错误,语料库,语言研究,拼写检查,纠错系统 数据概述:...
    packageimg
  • 罗马尼亚过渡书写系统数据集

    2025年6月1日   

    罗马尼亚过渡书写系统数据集 数据来源:互联网公开数据 标签:过渡书写系统,罗马尼亚,历史文档,OCR,字符统计,语言研究,文档分析 数据概述:...
    packageimg
  • 数据2020年美国总统辩论数据集

    2025年6月1日   

    数据2020年美国总统辩论数据集 数据来源:互联网公开数据 标签:美国总统辩论,2020选举,政治分析,音频录音,文本转录本,语言研究,政治科学 数据概述:...
    packageimg
  • 日语词典数据集JPNDictDataset-abhi5ingh

    2025年5月30日   

    日语词典数据集JPNDictDataset-abhi5ingh 数据来源:互联网公开数据 标签:语言学,词典,数据集,日语学习,自然语言处理,教育,翻译,语言研究 数据概述: 该数据集包含来自日语词典的数据,记录了日语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但内容涵盖现代日语常用词汇。...
    packageimg
  • 完整词典数据集Dict-Full-v1Dataset-phong2004

    2025年5月30日   

    完整词典数据集Dict-Full-v1Dataset-phong2004 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,词汇学,语言研究,机器学习,文本分析,教育技术 数据概述: 该数据集包含一个完整且经过整理的词典数据,记录了词汇及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围为词典的最近一次更新时间(具体年份未提供)。...
    packageimg
  • 印度手语数据集IndianSignLanguageDataset-chinmayd20

    2025年5月29日   

    印度手语数据集IndianSignLanguageDataset-chinmayd20 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,图像处理,深度学习,人工智能,语言研究,多媒体技术 数据概述: 该数据集包含来自印度手语相关的图像和视频数据,记录了印度手语的词汇、手势和表达方式。主要特征如下:...
    packageimg
  • 印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234

    2025年5月29日   

    印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234 数据来源:互联网公开数据 标签:印地语,数据集,语音识别,机器学习,自然语言处理,音素识别,学术资源,语言研究 数据概述:该数据集包含来自印度多所高校的印地语元音和辅音发音数据,记录了不同说话者的发音样本。主要特征如下:...
    packageimg
  • 阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune

    2025年5月29日   

    阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:...
    packageimg
  • 印度语文件数据集HindiLanguageFilesDataset-sherinkk

    2025年5月29日   

    印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
    packageimg
  • 维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044

    2025年5月28日   

    维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044 数据来源:互联网公开数据 标签:文本分析,词频统计,数据集,自然语言处理,语言研究,机器学习,词汇学,大数据 数据概述: 该数据集包含来自维基百科的文本数据,记录了维基百科中各词语的出现频率。主要特征如下:...
    packageimg
  • 法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd

    2025年5月14日   

    法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd 数据来源:互联网公开数据 标签:语言学习,数据集,金额表达,法语,教育技术,自然语言处理,机器学习,语言研究 数据概述: 该数据集包含来自公开语料库的法语金额表达数据,记录了法语中不同金额的书面和口语表达方式。主要特征如下:...
    packageimg
  • 法语和英语双语词典数据集DictionnaireFrançais-AnglaisDataset-dossivil

    2025年4月26日   

    法语和英语双语词典数据集DictionnaireFrançais-AnglaisDataset-dossivil 数据来源:互联网公开数据 标签:法语,英语,双语词典,语言学习,词典编纂,语言研究,翻译工具,教育资料 数据概述:该数据集包含来自互联网的法语和英语双语词典数据,记录了法语单词及其对应的英语翻译。主要特征如下:...
    packageimg
  • 西班牙语推特数据集SpanishTweetsDataset-furqanamjad

    2025年4月26日   

    西班牙语推特数据集SpanishTweetsDataset-furqanamjad 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据集,语言研究,舆情分析 数据概述: 该数据集包含来自Twitter平台的西班牙语推文数据,记录了用户发布的内容及其相关属性。主要特征如下:...
    packageimg
  • 多语种词汇过滤数据集PolifoniaLexiconAutomaticENFilteredDataset-eiriksteira

    2025年4月26日   

    多语种词汇过滤数据集PolifoniaLexiconAutomaticENFilteredDataset-eiriksteira 数据来源:互联网公开数据 标签:词汇学,数据集,自然语言处理,文本过滤,多语种,机器学习,语言研究,教育技术...
    packageimg