布哈里与穆斯林圣训数据集

布哈里与穆斯林圣训数据集 数据来源:互联网公开数据
标签:圣训,布哈里,穆斯林,孟加拉语,英语,宗教研究,文本分析,多语言支持

数据概述:
本数据集包含了布哈里和穆斯林圣训的孟加拉语和英语版本。孟加拉语版本的圣训数据从网站http://ihadis.com/抓取,英语版本的圣训数据从muslimscholars.info及qaalarasulallah.com数据库抓取,由Fahd整理并发布在Kaggle平台。数据集特别筛选了布哈里和穆斯林的圣训,并新增了一个字段“ narrators”,记录圣训的传述者。此外,数据集还包括了对孟加拉语和英语圣训进行简单EDA(探索性数据分析)的过程,以及生成最终版本的“ en_bn_translated_sahih_hadiths_final.csv”文件的代码。

数据用途概述:
该数据集适用于宗教文本研究、跨语言对比分析、文本挖掘、多语言NLP(自然语言处理)模型训练等场景。研究者可以利用此数据集进行圣训内容分析、传述者关系研究或语言转换模型的开发。教育机构可将其用于宗教文化教育或语言学研究。此外,该数据集还为跨语言文本对齐和翻译模型的训练提供了基础。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 39.17 MiB
最后更新 2025年4月19日
创建于 2025年4月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。