LSJ_Based_LAGT古希英词典_计算分析用数据

数据集概述

本数据集是基于LSJ词典构建的古希英数字词典,专为古希语文本计算分析设计,支持LAGT数据集相关研究。包含64,774个原始词元、46,693个标准化词元及对应英文释义,附Python查询脚本,适用于离线Python工作流,助力古希腊语料库语义与词汇探索。

文件详解

  • 文件名称:lsj_dictionary_v1_0_0.json
  • 文件格式:JSON
  • 字段映射介绍:每个条目含"lemma"(原始词元)、"lemma_normalized"(标准化词元)、"definitions"(英文释义列表)三个核心字段
  • 文件名称:lookup.py
  • 文件格式:.py
  • 字段映射介绍:命令行查询脚本,支持输入原始/标准化希腊词元检索释义
  • 文件名称:README.md
  • 文件格式:.md
  • 字段映射介绍:数据集说明文档,含背景、构建方法、使用指南等内容

适用场景

  • 古希腊语料库语义分析:为LAGT等古希语文本数据集提供词汇语义支撑,助力语义探索
  • 古典语言学计算研究:支持古希语词元标准化处理、词汇分布规律等计算语言学分析
  • 古希语文本挖掘工具开发:可集成到Python文本分析工作流,提升古希语文本处理效率
  • 数字人文研究辅助:为古典学、历史语言学等领域的数字人文研究提供词典数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 21.74 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。