-
WoPoss_Source_拉丁语模态演变研究语料库标注样本_2022
2026年1月22日 30 5 2
数据集概述 本数据集是WoPoss团队标注的WoPoss语料库样本,包含五部拉丁语经典文本:M. Minucius Felix的《Octavius》、P. Ovidius Naso的《Metamorphoses》(第一卷)、G. Petronius Arbiter的《Satyricon》、Q. S. F. Tertullianus的《De...
-
TRIDIS_Based_中世纪与近代早期多语言手稿手写文本识别模型数据11th_16th
2026年1月17日 30 117 94
数据集概述 本数据集包含TRIDIS手写文本识别(HTR)模型相关文件,该模型针对11-16世纪中世纪与近代早期多语言(拉丁语、古法语、古西班牙语)手稿设计,适用于法律、行政等纪实类手稿及文学、学术文献。数据集含模型文件与元数据,支持历史文本数字化与分析。 文件详解 文件名称:metadata.json 文件格式:JSON...
-
CIRCSE_Latin_Sentiment_Lexicons_Based拉丁语情感词典第二版发布数据
2026年1月2日 30 129 99
数据集概述 本数据集为CIRCSE/Latin_Sentiment_Lexicons的第二版发布资源,包含拉丁语形容词和名词的情感词典,新增融合黄金标准与白银标准的“Latin Affectus”数据集,且该数据集已关联至LiLa知识库,适用于拉丁语情感分析相关研究。 文件详解...
-
Multilingual_Dynamics_Based_中世纪佛兰德斯多语言文学手稿元数据_2024版
2026年1月2日 30 208 22
数据集概述 本数据集是“中世纪佛兰德斯多语言文学动态”项目的一部分,包含2539份现存中世纪佛兰德斯手稿(约1200-1500年)的元数据,涵盖荷兰语、法语和拉丁语文学文本,涉及手稿的基本信息、文本特征、来源、抄本学、装饰和书写体等6类主题,为研究该地区多语言文学文化的生产与接受提供基础数据。 文件详解 文件名称:Dataset...
-
拉丁语在医学术语中的作用
2025年12月23日 30 93 48
数据集概述 该数据集包含一篇探讨拉丁语在医学术语中作用的文章,指出拉丁语是医学术语的核心语言,未来医生需掌握拉丁语的解剖、临床及药学词汇,其学习需从语音语法及术语的读写训练开始。 文件详解 文件名称: Khafizova Mukharram Nematillaevna.pdf 文件格式: PDF 文件内容:...
-
数字人文语言差距研究补充数据集
2025年12月19日 30 161 62
数据集概述 本数据集是论文《数字人文中的语言差距:LLM辅助SKOS词表翻译》的补充数据,包含用于评估自动化SKOS词表翻译工具WOKIE的原始及翻译后的词表,覆盖考古学、文化时期等五个主题领域,以及本体匹配结果。 文件详解 该数据集由多个主题文件夹和结果文件夹组成,具体说明如下: - 主题词表文件夹(共五个): -...
-
古希腊与拉丁语翻译对齐标注指南及黄金标准数据集
2025年12月14日 30 60 53
数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...
-
数字人文语言鸿沟研究补充数据集
2025年12月13日 30 183 9
数据集概述 本数据集是论文《Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS...
-
SemEval_2020任务1拉丁语词汇语义变化检测数据集
2025年12月8日 30 153 125
数据集概述 本数据集包含SemEval 2020任务1(无监督词汇语义变化检测)的拉丁语测试数据,涵盖两个时期的拉丁语语料库对、40个标注目标词形及其语义变化评分,还提供语料库的原始词形版本,支持词汇语义变化研究。 文件详解 文件名称: semeval2020_ulscd_lat.zip 文件格式: ZIP压缩包 压缩包内包含内容:...
-
罗曼语动词屈折数据集2_0_0
2025年12月6日 30 126 22
数据集概述 该数据集为罗曼语动词屈折数据集2.0.0,覆盖73种罗曼语变体,提供基于宽式IPA音位符号的动词范式形式,按同源关系组织词位与范式单元,补充拉丁语范式并以CLDF格式发布,支持语言演变研究与语言学假设验证。 文件详解 文件名称: v2.0.4.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
拉丁语语料库数据集CorpusLatinDataset-nerdofdot
2025年4月24日 30 177 69
拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:...
-
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot
2025年4月24日 30 5 3
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:...



