-
YouTube_Abusive_Comments_数据集
2026年1月30日 30 52 8
数据集概述 本数据集收集了来自YouTube热门视频(如音乐视频、《小猪佩奇》等动画片)的辱骂评论及特定词汇,包含性辱骂评论等内容,为社交媒体评论内容分析提供基础数据支持。 文件详解 文件名称:Sexual Abusive Comments by Roma3 & INNO.xlsx 文件格式:XLSX...
-
奥克语标注语料库
2025年12月21日 30 61 49
数据集概述 该数据集为奥克语标注语料库,包含经人工标注词性和词元的奥克语文本,共28篇文档、12425个词元,标注流程详见指定学术文章,为奥克语自然语言处理研究提供基础数据。 文件详解 文件名称: CorpusRestaureOccitan.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含采用TSV CoNLL-...



