数据集

语言检测数据集

语言检测数据集数据来源：互联网公开数据标签：语言检测,文本分类,社交媒体分析,推特数据,多语言处理数据概述：本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据，涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据，总计13153行，每行数据包括两个列：推文内容和对应的标签。数据用途概述：该数据集适用于语言检测、文本分类、社交媒体分析等多种场景。研究人员可以利用此数据集训练和评估语言检测模型；企业可以借助数据集进行多语言内容分析；教育机构可利用数据集开展自然语言处理课程的教学实践。

数据与资源

语言检测数据集.zipZIP
0.91 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.91 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

语言检测数据集

数据与资源

附加信息

注册成功！