-
MatText_Package_分词器词汇表数据
2026年2月1日 30 192 53
数据集概述 本数据集包含MatText软件包分词器使用的词汇表文件,共15个文件,分为JSON和TXT两种格式。文件涵盖材料科学相关的多种词汇类型,如晶体学信息文件(CIF)、SMILES表达式、化学组成等词汇表,为材料文本处理任务提供基础分词资源。 文件详解 JSON文件(8个,占比约53.33%)...
-
ASNC_Based早期爱尔兰词汇表数据库XML档案
2026年1月31日 30 71 38
数据集概述 本数据集为早期爱尔兰词汇表数据库的XML档案,包含Sanas Cormaic、O’Mulconry’s Glossary、Dúil Dromma Cetta及短篇文本Loman和Irsan的各版本XML文件,共十八个文件,是研究中世纪爱尔兰文学与文化环境的重要资源。 文件详解 数据文件...
-
EFSA_欧盟环境中动物传染病监测结构与方法研究数据
2026年1月31日 30 89 10
数据集概述 本数据集是基于两项文献综述的研究补充数据,分别针对欧盟环境中动物传染病监测的现有结构、系统性/学术性举措,以及环境中病原体监测方法。数据通过标准化数据模型提取自科学文献,包含监测系统特征、样本类型、检测方法等关键信息,以Excel文件形式呈现,共2个文件。 文件详解 文件名称:D_2.2_environment_Annex_1.xlsx...
-
Kam_kdx_Lesage非洲语言词汇表数据2019
2026年1月31日 30 167 66
数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
-
CEOML_Based_职业参与度机器学习分类器开发数据
2026年1月30日 30 133 86
数据集概述 本数据集包含CEOML(职业参与度机器学习分类器)开发过程中的原始数据、代码及模型文件,总计11个文件。核心内容为用于量化职业参与度上下文的文本数据、分类模型文件、训练配置及分析代码,支持对职业参与度分类模型的复现与研究。 文件详解 模型相关文件...
-
Pere_Based科特迪瓦濒危语言动植物词汇表完整数据
2026年1月30日 30 6 2
数据集概述 本数据集为科特迪瓦Pere(又称Bere、Mbre)语言的动植物词汇表。Pere是科特迪瓦中部的严重濒危语言,在Glottolog中以代码mbre1244、ISO 639-3中以代码mka收录。数据集包含一份Excel文件,记录该语言中动植物相关术语,为濒危语言保护和词汇研究提供基础资源。 文件详解 文件名称:Pɛrɛ flora...
-
Pere_Lexicon_Based科特迪瓦濒危语言词汇表数据
2026年1月28日 30 22 15
数据集概述 本数据集为科特迪瓦Pere语(文献中亦称Pɛrɛ、Bere、Mbre)的词汇表,Pere语是科特迪瓦中部的严重濒危语言,在Glottolog中以"Mbre"收录(代码mbre1244),ISO 639-3代码为mka。数据集包含一份词汇表文件,可用于濒危语言保护与语言学研究。 文件详解 文件名称:Pere lexicon.xlsx...
-
Enggano_Based_1895年词汇表CLDF标准化数据集
2026年1月27日 30 78 68
数据集概述 本数据集为1895年Enggano词汇表的数字化CLDF格式版本,匹配了Holle List的英文及印尼语释义,包含Enggano词汇的通用正字法、原始转录、音素分割及国际音标转写等信息,适用于濒危语言词汇研究与跨语言比较分析。 文件详解 文件名称:engganolang/holle-list-enggano-1895-2.0.0.zip...
-
Pama_Nyungan_Based_颜色词汇修订数据_语言学分析
2026年1月27日 30 173 114
数据集概述 本数据集为修订后的Pama-Nyungan语言颜色词汇表,包含约187种Pama-Nyungan语言的基础颜色术语。数据基于PNAS发表的Word表格修订,补充了Nash 2017年研究的修正内容,为语言学领域研究颜色术语演变提供结构化数据支持。 文件详解 文件名称:amended PNy colour vocabs...
-
SUN_Spot_Based_RGB_D图像空间指代表达式标注数据集
2026年1月27日 30 119 44
数据集概述 本数据集是基于SUNRGBD图像数据集的空间指代表达式(REs)标注数据,用于定位图像中的目标对象。它是唯一使用RGB-D图像的RE数据集,平均空间介词数量更多,场景更杂乱。包含3个文件,无目录结构和数据拆分。 文件详解 instances.json 文件格式:JSON...
-
ANU_Based_澳大利亚语言词汇表方案整合数据_20181101
2026年1月23日 30 201 185
数据集概述 本数据集是澳大利亚语言各类“基础词汇表”的Excel汇编,整合了多位作者的研究成果,对英文注释及参考代码进行了对齐,并添加了来自ANU语言学网站的语义编码,为澳大利亚语言词汇研究提供结构化参考。 文件详解 文件名称:various_wordlist_schemes_20181101.xlsx 文件格式:XLSX...
-
riie_net_Source_动漫影视基础信息数据集_20200218
2026年1月22日 30 146 84
数据集概述 本数据集是2020年2月18日从riie.net网站采集的动漫影视数据,包含199条动漫剧集和电影记录,涉及标题、类型、集数、状态、发行日期等13个字段,涵盖多种流派信息,为动漫影视相关研究提供结构化基础数据。 文件详解 数据文件 文件名称:ListAnime.csv 文件格式:CSV...
-
Polyglotta_Africana_Based_非洲语言词汇比较数据集_v2_1
2026年1月14日 30 122 17
数据集概述 本数据集基于Koelle 1854年的《Polyglotta Africana》,包含非洲一百多种语言中近三百个词汇和短语的比较词汇表,以CLDF格式整理,为非洲语言比较研究提供结构化资源。 文件详解 文件名称:lexibank/polyglottaafricana-v2.1.zip 文件格式:ZIP(压缩包)...
-
Tomoip_Based_2023年Barlow和Killian语言词汇表CLDF数据集
2026年1月13日 30 33 24
数据集概述 本数据集是基于Barlow和Killian于2023年发布的《Tomoip Wordlist》生成的CLDF格式数据集,词汇表内容源自2022年10月至11月在东新不列颠省科科波与Milim村的Simon Mangil进行的 elicitation会话记录,为Tomoip语言研究提供结构化词汇资源。 文件详解...
-
Tiefo_D_Lexicon_Based语言词汇表_Daramandugu地区_2021年4月
2026年1月8日 30 164 85
数据集概述 本数据集为Daramandugu地区Tiefo-D语言的词汇表,需与同作者的《Tiefo-D语法》(DOI:10.5281/zenodo.4715103)及《Tiefo-D文本集》(DOI:10.5281/zenodo.4715132)配合使用,使用说明见语法附录及文本集附录。后续将在密歇根大学图书馆Deep...
-
伊纳蒂语词汇表数据集
2025年12月22日 30 14 2
数据集概述 本数据集包含伊纳蒂语(Inati)词汇表相关资料,由母语者Delia Panden编写,旨在作为小学入门教材。内容涵盖手写手稿照片及部分英文注释文档,为伊纳蒂语研究提供基础数据支持。 文件详解 图片文件(共12个):...
-
数据质量评估需求规范与交换词汇表
2025年12月22日 30 208 39
数据集概述 该数据集是用于规范和交换数据质量评估需求的词汇表(DaQAR),基于已有成熟词汇表(如数据质量词汇表DQV)构建,为数据质量评估需求的标准化表达提供支持。 文件详解 daqar.ttl: TTL格式文件,可能包含词汇表的结构化定义,用于语义网或本体工具解析。 daqar.html:...
-
澳大利亚土壤化学方法手册的机器可读表示数据集
2025年12月22日 30 102 79
数据集概述 本数据集是澳大利亚土壤化学方法手册的机器可读表示(资源描述框架RDF格式),包含土壤化学测试方法的词汇表(两个概念方案),数据转换自1992年和2011年的土壤化学方法出版物,涵盖结果代码、度量单位及方法间关系等内容。 文件详解 文件名称:ANZSoilData/def-au-scm-v1.0.0.zip 文件格式:ZIP压缩包...
-
科辛语225词表数据集
2025年12月20日 30 65 31
数据集概述 该数据集为科辛语(Koshin)的225词表,科辛语属于也门-金比语组,通行于喀麦隆西北部Menchum区Fungom分区的下Fungom地区。数据包含语言词汇及声调、名词前缀特征,同时记录了两位顾问提供的词汇变体差异。 文件详解...
-
MontoloSHACLStats_Based_语义网SHACL约束统计完整数据
2025年12月20日 30 110 72
数据集概述 该数据集包含从GitHub及网络资源下载的SHACL形状语料库(raw-目录),以及使用montolo工具和Python脚本生成的约束使用统计数据(stats-目录),统计数据遵循montolo词汇表以RDF格式描述。 文件详解 文件名称: montolo-shape-stats.zip 文件格式: ZIP (.zip) 文件内容:...



