数据集

泰米尔语新闻分类数据集

泰米尔语新闻分类数据集数据来源：互联网公开数据
标签：泰米尔语,新闻分类,文本分类,自然语言处理,新闻文章,文本数据,机器学习

数据概述：
本数据集包含约12.7万篇泰米尔语新闻文章及其对应的分类标签，旨在用于评估泰米尔语文本分类器的性能。数据集中的文章来源于互联网公开数据，具体来自Tamilmurasu.org，该网站是印度泰米尔纳德邦知名的新闻平台。数据涵盖的时间范围为2011年6月1日至2020年6月1日，内容涉及多个新闻类别，为研究泰米尔语新闻分类提供了丰富的数据基础。

数据用途概述：
该数据集适用于泰米尔语文本分类模型的训练与评估，支持自然语言处理领域的学术研究和工业应用。研究人员可以利用此数据集优化分类算法，提升模型在泰米尔语新闻分类任务中的性能。此外，数据集还可用于新闻内容分析、语义理解、关键词提取等场景，为泰米尔语信息处理技术的发展提供有力支持。

数据与资源

泰米尔语新闻分类数据集.zipZIP
84.31 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	84.31 MiB
最后更新	2025年4月27日
创建于	2025年4月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

泰米尔语新闻分类数据集

数据与资源

附加信息

注册成功！