-
Webis_QSpell_17_Based_2017年人工拼写检查网络查询语料库
2026年1月15日 30 168 63
数据集概述 本数据集为Webis Query Spelling Corpus 2017(Webis-QSpell-17),包含54,772条经人工拼写检查的网络查询数据,其中9,171条查询提供了替代拼写变体。数据集仅含一个压缩文件,无训练测试或数据标签分割,可用于自然语言处理领域的拼写检查相关研究。 文件详解 文件名称:corpus-webis-...
-
阿拉伯语拼写错误平行语料库数据集
2025年6月4日 30 169 2
阿拉伯语拼写错误平行语料库数据集 数据来源:互联网公开数据 标签:阿拉伯语,拼写错误,语料库,语言研究,拼写检查,纠错系统 数据概述:...
-
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal
2025年5月29日 30 138 118
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本校对,拼写检查,自然语言处理,数据集,机器学习,语言模型,文本纠错,数据清洗 数据概述: 该数据集包含用于文本校对和拼写检查的文本数据,记录了包含拼写错误和对应正确拼写的文本对。主要特征如下:...
-
阿拉伯语拼写数据集SpellArabicDataset-twproject
2025年4月25日 30 126 95
阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
-
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007
2025年4月24日 30 28 4
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007 数据来源:互联网公开数据 标签:语言处理,拼写检查,数据集,自然语言处理,机器学习,纠错算法,文本分析,语言技术 数据概述:...
-
孟加拉语拼写检查数据集
2025年4月14日 30 185 109
孟加拉语拼写检查数据集 数据来源:互联网公开数据 标签:孟加拉语,拼写检查,词表,语言处理,数据词典,研究工具,自然语言处理 数据概述:...
-
乌兹别克斯坦宪法NLP数据集
2025年4月14日 30 95 6
乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...



