语言检测数据集

语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述: 该数据集适用于语言检测、文本分类、社交媒体分析等多种场景。研究人员可以利用此数据集训练和评估语言检测模型;企业可以借助数据集进行多语言内容分析;教育机构可利用数据集开展自然语言处理课程的教学实践。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.91 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。