印度孟加拉语自由诗歌数据集2021-truthr

印度孟加拉语自由诗歌数据集2021-truthr 数据来源:互联网公开数据 标签:孟加拉语,诗歌,数据集,免费资源,自然语言处理,文本生成,预训练模型,下游任务,CC-BY-SA 4.0

数据概述: 本数据集包含2,686首来自著名孟加拉语诗人的诗歌,所有诗歌均完全属于公共领域。这些诗歌可以用作预训练模型的微调数据源,特别是用于诗歌生成等下游任务。数据集包含了详细的README.md文件、poets.csv文件,其中包含了每首诗歌的详细信息和诗人描述。

数据用途概述: 该数据集适用于自然语言处理任务,特别是预训练模型的微调,例如文本生成、诗歌创作等。研究人员和开发者可以利用此数据集来训练和优化模型,以便生成高质量的孟加拉语诗歌。此外,该数据集还可以用于教育和文化推广,帮助人们更好地理解和欣赏孟加拉语诗歌文化。

数据集的许可协议为CC-BY-SA 4.0,允许在遵循许可协议的前提下进行自由使用、分享和修改。若使用本数据集进行研究,请引用以下信息:

@misc{ritobrata ghosh_2021, author = {Ritobrata Ghosh}, year = {2021}, title = {Free Bengali Poetry}, publisher = {Kaggle}, address = {Kolkata, India} }

或引用方式为:Ritobrata Ghosh, 深度学习实践者。

更多相关信息请参考README.md文件。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.63 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。