-
ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据
2026年1月30日 30 97 14
数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
-
dijak_Concordance_Slovenian_Italian双语对照条目数据
2026年1月14日 30 113 0
数据集概述 本数据集展示斯洛文尼亚语术语“dijak(中学生)”与其意大利语对应词的双语对照条目,来源于斯洛文尼亚共和国官方公报中具有法律约束力的斯洛文尼亚-意大利双语文本。包含2004-2024年斯洛文尼亚伊斯特拉地区84份双语出版物的相关内容,涉及学前和初等教育及奖学金领域,用于呈现术语在官方话语中的使用场景、语义差异及翻译选择。 文件详解...
-
dijak_Bilingual_Slovenian_Italian官方公报术语对应条目数据
2026年1月12日 30 113 54
数据集概述 本数据集呈现斯洛文尼亚语术语“dijak(中学生)”与其意大利语对应词的双语对应条目,数据源自斯洛文尼亚共和国官方公报发布的2004-2024年斯洛文尼亚-意大利双语法律文本,含84篇出版物,涵盖学前及初等教育、奖学金相关内容,展示术语在官方话语中的使用场景、语义差异及翻译选择。 文件详解 文件名称:Bilingual...
-
现代标准斯拉夫语支平行文本数据集
2025年12月22日 30 191 72
数据集概述 本数据集包含克罗地亚语、斯洛伐克语、斯洛文尼亚语三种现代标准斯拉夫语支的平行文本,以《约翰福音》为内容,通过平行文本设计抵消体裁影响,为语言比较研究提供基础数据。 文件详解 文件名称:Gospel.Croatian.txt;格式:TXT;内容:克罗地亚语版《约翰福音》文本,基于伊万·沙里奇的新约译本...
-
斯洛文尼亚语含次级未完成体语素调整的Lec型名物化数据集
2025年12月16日 30 13 7
数据集概述 该数据集基于Arsenijević等人2024年的数据集衍生,核心记录斯洛文尼亚语中Lec型名物化(原数据集标注为lc-)的次级未完成体语素调整现象,包含调整后语素的名物化形式及其在国家语料库Gigafida 2.0中的出现频率。 文件详解 说明文档:Instructions for_Lec-nominalizations with an...
-
斯洛文尼亚语形容词形态标注数据库2024
2025年12月13日 30 78 52
数据集概述 本数据集包含斯洛文尼亚语中六千个最常用形容词的形态标注,基于Gigafida 2.0语料库2024年3月的抽样数据提取。标注涵盖词缀、复合结构、非派生性等核心形态特征,为斯洛文尼亚语形态学研究提供结构化数据支持。 文件详解 文件名称: Annotated database of Slovenian adjectives.xlsx 文件格式:...
-
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集
2025年4月14日 30 150 67
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO...



