找到29个数据集

标签: 语言分布

过滤结果
  • CLS_INFRA_Based_基线方法学用户需求分析补充数据

    2026年1月28日 30 139 78

    数据集概述 本数据集为CLS INFRA框架下WP3的基线方法学用户需求分析补充数据,包含语料库元数据、格式/方法/工具分析结果等9个文件,覆盖全量与开放获取、CLS分类的语料库信息,支持自然语言处理领域的用户需求研究与语料库分析。 文件详解 说明文档类 文件名称:0_README.md 文件格式:MD 字段映射介绍:提供数据集开发背景(CLS...
    packageimg
  • SDGs_Based_智利天主教大学2017年文章分类数据_完整版

    2026年1月27日 30 71 5

    数据集概述 本数据集包含智利天主教大学2017年发表的2379篇英文或西班牙文期刊文章,来源于Web of Science和Scopus数据库(已去重)。数据经专家团队分类,涵盖联合国可持续发展目标(SDGs)17个目标及“未分类”共18个类别,包含169个子类别,同时记录了分类审核状态,是研究高校科研成果与SDGs关联的结构化资料。 文件详解...
    packageimg
  • Netflix_Europe_视听产品与投资策略比较分析数据2020

    2026年1月26日 30 131 98

    数据集概述 本数据集用于对比分析Netflix在比利时、罗马尼亚、西班牙和瑞典四个欧盟国家的视听产品与投资策略。2020年4月7日通过网络爬虫从第三方来源收集,包含四国的内容目录及作品元数据,为研究流媒体平台区域战略提供结构化资料。 文件详解 文件名称:Dataset_4 cases_merge_final.xlsx 文件格式:XLSX...
    packageimg
  • Lee_Hasegawa_Based_Ainu语言时空演化CLDF数据集

    2026年1月21日 30 196 192

    数据集概述 本数据集是基于Lee和Hasegawa 2013年发表的《Ainu Language in Space and Time》研究生成的CLDF格式数据集,包含与阿伊努语言时空演化相关的语言数据,以压缩文件形式存储,是研究阿伊努语言演化的结构化参考资料。 文件详解 文件名称:lexibank/leeainu-v1.2.zip 文件格式:ZIP...
    packageimg
  • Mouton_Atlas_Based_语言与文化地图集基础数据集_2019版

    2026年1月20日 30 41 37

    数据集概述 本数据集为《Mouton语言与文化地图集》(2019年版)的基础数据,用于生成地图、图表及书中结果。数据提取自历时比较语言学问卷数据库,包含四份附录文件,支持语言文化相关的可视化与分析应用。 文件详解 附录文件(共4份)...
    packageimg
  • Blust_Austronesian_Based南岛语基础词汇数据库数据_2008

    2026年1月15日 30 48 4

    数据集概述 本数据集是基于Blust的南岛语数据编码而来的CLDF数据集,用于南岛语基础词汇数据库。数据集源自2008年的研究,包含一个压缩文件,无训练/测试、数据/标签或原始/处理数据的拆分,无自述文件或内容预览。 文件详解 SequenceComparison/blustaustronesian-v1.1.zip 文件格式:ZIP...
    packageimg
  • Colexifications_Pain_Disgust_Joy_Interjections_研究数据集

    2025年12月31日 30 92 1

    数据集概述 本数据集为研究疼痛、厌恶与喜悦感叹词共现现象的专用数据,包含5个文件,涵盖说明文档、来源信息、核心数据等内容。数据支持语言学领域对感叹词语义关联及跨语言共现模式的分析,文件类型以CSV为主,辅以XLSX格式,无目录层级划分。 文件详解 说明文档文件 文件名称:Ponsonnet IntjColex_read me_250128.csv...
    packageimg
  • 绿金刚鹦鹉_Ara_militaris_与厚嘴鹦鹉_Rhynchopsitta_pachyrhyncha_1967_2019年科学研究文献计量分析数据集

    2025年12月27日 30 17 16

    数据集概述 本数据集为绿金刚鹦鹉(Ara militaris)与厚嘴鹦鹉(Rhynchopsitta pachyrhyncha)的科学研究文献计量分析数据,涵盖1967至2019年来自Scopus和Web of Science数据库的82条记录。通过单维与二维文献计量指标分析,识别研究热点与缺口,为濒危鹦鹉保护研究提供方向。包含5个数据文件。 文件详解...
    packageimg
  • 哥伦比亚文学与文化期刊数据集1881_1950

    2025年12月22日 30 46 19

    数据集概述 本数据集包含哥伦比亚文学杂志文化转移数字化与分析项目(1892–1950)的成果,涵盖二十八种期刊的数据集模型、作者传记统一模型、期刊中发表的翻译作品子集、女性发表文本子集及网络分析可视化数据模型,为研究哥伦比亚期刊文化传播提供支持。 文件详解 文件名称: README.txt:文本格式,包含数据集基本信息、作者信息及创建时间等说明。...
    packageimg
  • 乌拉尔语系地理数据库

    2025年12月21日 30 165 3

    数据集概述 该数据集包含乌拉尔语系过去与当前分布的原始数字空间数据集及最终地图。数据由多机构资助的跨学科团队联合乌拉尔语专家收集,以矢量数据可视化语言分布,支持空间语言学及多学科研究,直观呈现乌拉尔语系及其方言的研究现状。 文件详解 文件名称:Geographical database of the Uralic languages.zip...
    packageimg
  • 澳大利亚语言分布位置数据集

    2025年12月21日 30 141 19

    数据集概述 本数据集记录了欧洲殖民时期澳大利亚原住民及托雷斯海峡岛民语言的分布位置,包含语言区域多边形、语群及语系边界、语言中心点坐标,以及语言分类、代码体系等信息,为研究澳大利亚本土语言地理分布提供数据支持。 文件详解 地理空间数据文件(GIS格式):...
    packageimg
  • 伊拉克地理文化相关资源数据集

    2025年12月20日 30 173 159

    数据集概述 该数据集包含与伊拉克地理文化相关的资源,涵盖伊拉克的基本国家信息、地理区位、民族构成、宗教分布及官方语言等内容,配套提供图片及三维模型文件,为了解伊拉克基础情况提供多类型资源支持。 文件详解 三维模型文件: 012150c21fa2469598346e6ca4342e28.glb: GLB格式三维模型文件,具体内容未提供预览 图片文件:...
    packageimg
  • 所罗门群岛语言内部分类CLDF数据集1983

    2025年12月18日 30 205 99

    数据集概述 该数据集是基于Tryon和Hackman1983年发表的《Solomon Islands Languages: An internal classification》构建的CLDF格式数据集,包含所罗门群岛语言的内部分类相关数据,为语言分类研究提供支持。 文件详解 文件名称:lexibank/tryonsolomon-v3.1.zip...
    packageimg
  • 欧洲地名命名原则与多语言地名研究附录数据集

    2025年12月14日 30 147 38

    数据集概述 该数据集包含论文《Endonymiprinsippet og flerspråklige stedsnavn i Europa》(欧洲地名命名原则与多语言地名)的完整研究结果,由PDF文档和Excel表格组成,为欧洲多语言地名及语言分布研究提供数据支持。 文件详解 文件名称:...
    packageimg
  • 坦桑尼亚语言调查CLDF数据集1975

    2025年12月11日 30 189 85

    数据集概述 本数据集是基于Nurse和Philippson于1975年开展的《坦桑尼亚语言调查》项目生成的CLDF格式数据集,包含坦桑尼亚语言调查相关数据,为语言研究提供标准化数据支持。 文件详解 文件名称: lexibank/tls-v4.2.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 中国与老挝倮倮_缅甸语支Cosao语言分类数据集

    2025年12月11日 30 18 12

    数据集概述 该数据集围绕倮倮-缅甸语支的Cosao语言分类展开,包含其在中老边境的分布、词汇比较证据及计算系统发育学分析结果,明确其为南倮倮语支且与老挝Khir语言关系密切,为语言谱系研究提供数据支持。 文件详解 文件名称:The_classification_of_Cosao_PPT.pdf 文件格式:PDF...
    packageimg
  • Uto_Aztecan语系起源研究CLDF数据集2022

    2025年12月9日 30 99 28

    数据集概述 本数据集是配合Greenhill等人2022年关于“Uto-Aztecan语系起源”研究的CLDF格式数据,为探究该语系的起源提供语言学数据支持,以压缩包形式存储。 文件详解 文件名称:utoaztecan-v1.4.zip 文件格式:ZIP压缩包(.zip) 存储位置:位于lexibank/目录下,为数据集的唯一文件 数据来源 Max...
    packageimg
  • D_PLACE项目数据库_地点语言文化与环境数据v2_2_1

    2025年12月7日 30 129 127

    数据集概述 该数据集是D-PLACE项目(地点、语言、文化与环境数据库)的数据仓库,包含与全球各地人类社会相关的地点、语言、文化实践及环境背景的综合数据,为跨学科研究提供基础资料。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: dplace-data-v2.2.1.zip - 文件格式: ZIP压缩包(.zip) - 内容说明:...
    packageimg
  • 太平洋地区语言地图集CLDF数据集

    2025年12月6日 30 71 6

    数据集概述 该数据集是基于1981年和1983年Wurm与Hattori所著《太平洋地区语言地图集》的ECAI数字化版本生成的CLDF格式数据集,覆盖新几内亚、大洋洲、澳大利亚、日本、台湾、菲律宾及东南亚等区域的语言信息,为语言研究提供结构化数据支持。 文件详解 文件名称: cldf-...
    packageimg
  • 世界语言景观中的国家层面语言学研究对象

    2025年12月6日 30 201 121

    数据集概述 本数据集聚焦于“世界语言景观中的国家层面”这一语言学研究对象,通过单一PDF文档呈现相关研究内容,为语言学领域关于语言景观的国家维度分析提供资料支持。 文件详解 文件名称: Akramova Guljakhon.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg