数据集

波斯语拼写纠错数据集-FASpell数据集

波斯语拼写纠错数据集-FASpell数据集数据来源：互联网公开数据标签：波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习

数据概述： FASpell数据集旨在用于评估波斯语（Farsi）拼写纠错算法的性能。该数据集包含一组波斯语拼写错误的单词及其对应的正确形式，类似于英文的ASpell数据集。数据集由两部分组成：faspell_main，包含5050对来自小学生和专业打字员的错误; faspell_ocr，包含800对来自波斯语光学字符识别（OCR）系统的输出。

数据用途概述：该数据集主要用于以下方面：评估和开发波斯语拼写纠错系统，研究波斯语拼写错误模式，训练机器学习模型进行拼写纠正，以及进行语言学研究。研究人员可以利用该数据集分析不同类型的拼写错误发生的频率，识别易错字符或单词，并构建基于有限状态自动机的波斯语拼写检查器。此外，该数据集也适用于教育领域，帮助学生和语言学习者了解波斯语的常见拼写错误，提高语言准确性。

数据与资源

波斯语拼写纠错数据集-FASpell数据集.zipZIP
0.05 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.05 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

波斯语拼写纠错数据集-FASpell数据集

数据与资源

附加信息

注册成功！