UGSC_Based_可持续交通多语言情感分类数据集_研究用

数据集概述

本数据集为用户黄金标准语料库(UGSC)的多语言版本,包含英文、西班牙文、法文、德文、意大利文五种语言的句对齐翻译文本,以及预训练XLM-RoBERTa模型的分类结果,支持多语言情感模型的可复现评估,助力交通相关自然语言处理应用研究。

文件详解

  • 主文件包
  • 文件名称:UGSC_multilingual_sentiment_package.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含可持续交通领域的多语言情感文本数据,涵盖五种语言的句对齐翻译内容及XLM-RoBERTa模型的情感分类结果,具体字段需解压后查看原始文件结构。

数据来源

研究“Cross-Lingual Sentiment Classification in Sustainable Mobility: A Zero-Shot Evaluation Framework”

适用场景

  • 多语言情感模型评估: 用于复现零样本场景下跨语言情感分类模型的性能测试与验证。
  • 可持续交通NLP研究: 支持交通领域自然语言处理应用中情感分析方向的算法开发与优化。
  • 跨语言文本对齐研究: 基于五种语言的句对齐数据,探究不同语言间情感表达的一致性与差异。
  • 预训练模型迁移学习: 以XLM-RoBERTa分类结果为基准,开展交通领域情感模型的迁移学习实验。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.09 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。