-
MatText_Package_分词器词汇表数据
2026年2月1日 30 60 8
数据集概述 本数据集包含MatText软件包分词器使用的词汇表文件,共15个文件,分为JSON和TXT两种格式。文件涵盖材料科学相关的多种词汇类型,如晶体学信息文件(CIF)、SMILES表达式、化学组成等词汇表,为材料文本处理任务提供基础分词资源。 文件详解 JSON文件(8个,占比约53.33%)...
-
WASP_Based_服务平台网络架构应用评估材料数据
2026年1月30日 30 164 83
数据集概述 本数据集为WASP(Web Architectures for Services Platforms)应用的评估材料,是论文中某一案例研究的支撑数据。包含文本文件与表格文件,记录了WASP应用相关的词汇、短语、影响集、需求、传播条件及结果等内容,总计6个文件。 文件详解 WASP_Words.txt 文件格式:TXT...
-
BMSatire_Based语料库语言学分析数据_附文档
2026年1月30日 0 78 9
数据集概述 本数据集包含BMSatire Descriptions语料库的分析数据及相关文档,属于英国学术院资助项目“Curatorial Voice: legacy descriptions of art objects and their contemporary uses”的成果。语料库源自M. Dorothy...
-
Digital_Emotion_Analysis_基于阿卡德语的爱情情感数字分析研究数据
2026年1月13日 30 3 0
数据集概述 本数据集为论文《Digital Approaches to Analyzing and Translating Emotion: What Is Love?》的研究数据,包含阿卡德语爱情词汇分析所用的列表、网络与图表、Oracc原始数据、PMI和fastText分析结果及文本文件,共7个文件,用于情感分析与翻译的数字方法研究。 文件详解...
-
希腊拉丁纸草文献词汇列表数据集20240521
2025年12月18日 30 167 66
数据集概述 该数据集为2024年5月21日更新的纸草文献词汇列表,收录了An.Pap. 33、BGU 21等多份纸草文献中的词汇,按希腊语和拉丁语分类,涵盖名称、地理、宗教等类别,包含613条新词汇条目,为纸草文献词汇研究提供结构化数据。 文件详解 文件名称:cceh/papyri-wl-data-v27.zip 文件格式:ZIP压缩包...
-
缅语族语言词汇数据机器可读集合
2025年12月5日 30 84 63
数据集概述 本数据集包含缅语族语言的词汇列表,大部分词汇已按WordNet进行语义标准化,全面整合了已发表的缅语族语言数据,为缅语族语言词汇研究提供机器可读的基础数据支持。 文件详解 压缩文件集合: burmish.list.zip:词汇列表压缩文件 burmish.table.zip:表格形式的词汇数据压缩文件...
-
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903
2025年5月1日 30 153 95
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903 数据来源:互联网公开数据 标签:停用词, 词汇列表, 自然语言处理, 文本分析, 语料库, 文本预处理, 词汇统计, 语言模型 数据概述:...
-
新学术词汇列表数据集
2025年4月14日 30 102 69
新学术词汇列表数据集 数据来源:互联网公开数据 标签:学术英语,词汇列表,语言学习,教育,词汇覆盖,学术文本,核心英语 数据概述:...



