-
HEREDITermCorpus_pt_V0_1_HEREDITARY项目_葡萄牙语微生物群_肠_脑轴文本语料库
2025年12月27日 30 56 13
数据集概述 本数据集是HEREDITARY项目下的葡萄牙语文本语料库,聚焦微生物群-肠-脑轴(MGBA)及其在神经退行性疾病中的作用,包含126篇文档、100,610个句子、约200万词汇和267万词元,为相关领域研究提供结构化文本资源。 文件详解 文件名称:HerediTermCorpus_pt.xlsx 文件格式:XLSX...
-
Stanford_GloVe_6B_Based_多维度词向量预训练完整数据
2025年12月21日 30 130 70
数据集概述 本数据集为GloVe 6B词向量,基于维基百科2014和Gigaword 5语料(共60亿个词元)训练生成,包含40万个词汇,提供50维、100维、200维、300维四种维度的词向量,已转换为gensim二进制格式并压缩为ZIP文件。 文件详解...
-
英美英语词汇量比较分析研究
2025年12月11日 30 146 61
数据集概述 本数据集围绕英国英语与美国英语的词汇量差异展开比较分析研究,包含一份相关的PDF文档,为探讨两种英语变体在词汇使用上的特征与区别提供资料支持。 文件详解 文件名称:Alijonova Barnoxon Valijon qizi.pdf 文件格式:PDF(.pdf)...
-
通过人工智能增强词汇量数据集
2025年12月9日 30 10 0
数据集概述 本数据集围绕通过人工智能增强词汇量的主题,包含一份PDF文档,为相关研究或实践提供参考资料。 文件详解 文件名称: Rustamova Jamila .pdf 文件格式: PDF (.pdf) 文件内容: 文档主题为通过人工智能增强词汇量,具体内容需查看PDF文件获取。 适用场景 人工智能教育应用研究:...
-
ICDAR2003非正式在线单词识别竞赛数据集_Unipen_ICROW_03基准集_V0_0
2025年12月9日 30 21 2
数据集概述 本数据集是ICDAR2003非正式在线单词识别竞赛的基准集,包含来自不同平板设备、国籍和语言的孤立在线自由手写(手写体、混合体、草书)单词数据,支持ASCII字符集标签,可用于评估“即学即用”识别性能。 文件详解 文件名称: _README.txt 文件格式: TXT 内容:...
-
外语教学中词汇量及其发展影响的方法学因素数据集
2025年12月7日 30 207 185
数据集概述 本数据集聚焦外语教学场景,分析影响学习者词汇量形成与发展的方法学因素,探讨词汇量作为语言能力核心组件的关键作用,涵盖多种教学方法及相关影响因素的研究内容。 文件详解 文件名称: 5-9.pdf 文件格式: PDF 内容说明:...
-
加泰罗尼亚语词汇游戏Paraulògic词汇数据集
2025年4月14日 30 207 60
加泰罗尼亚语词汇游戏Paraulògic词汇数据集 数据来源:互联网公开数据 标签:加泰罗尼亚语,词汇游戏,语言学习,词汇量,游戏数据,拼字游戏,罗达莫斯 数据概述: 本数据集收录了加泰罗尼亚语词汇游戏Paraulògic的词汇数据,该游戏由Rodamots创建,旨在测试玩家的词汇能力。数据集包含两个主要文件:...



