Flexico_Source_自适应可持续机器翻译实验复现数据

数据集概述

本数据集用于复现论文“Flexico: Sustainable Machine Translation via Self-Adaptation”的研究结果,包含6个文件,涉及香港新闻和opus_eng_fra数据集的实验数据,涵盖聚类距离、时间统计等机器翻译自适应相关指标,支持可持续翻译模型的实验验证。

文件详解

  • 香港新闻数据集相关文件
  • 文件名称:tmp_metrics-hk-news.zip、fid-dataset_hk-news-timeInterval_1-timeIntervalType_time-finetuneType_base.csv、general_fid-finetune_data-dataset_hk-news-timeInterval_1-timeIntervalType_time-finetuneType_base.csv
  • 文件格式:ZIP(1个)、CSV(2个)
  • 字段映射介绍:CSV文件包含finetune_data-sent_embedding_cluster_dist-cosine(余弦聚类距离)、finetune_data-sent_embedding_cluster_dist-euclidean(欧氏聚类距离)、finetune_data-sent_embedding_total_time(嵌入总时间)等指标
  • opus_eng_fra数据集相关文件
  • 文件名称:tmp_metrics-opus_eng_fra.zip、fid-dataset_opus_eng_fra-timeInterval_10000-timeIntervalType_sentence-finetuneType_base.csv、general_fid-finetune_data-dataset_opus_eng_fra-timeInterval_10000-timeIntervalType_sentence-finetuneType_base.csv
  • 文件格式:ZIP(1个)、CSV(2个)
  • 字段映射介绍:CSV文件包含test-set(测试集标识)、finetune_data-sent_embedding_cluster_dist-cosine、finetune_data-sent_embedding_total_time等指标

数据来源

论文“Flexico: Sustainable Machine Translation via Self-Adaptation”

适用场景

  • 机器翻译模型复现: 用于复现Flexico自适应可持续机器翻译模型的实验结果
  • 自然语言处理研究: 分析机器翻译中的句子嵌入聚类、时间效率等自适应相关指标
  • 翻译模型优化: 基于聚类距离、时间统计等数据优化自适应翻译模型的可持续性
  • 多数据集翻译实验: 支持香港新闻和opus_eng_fra等不同数据集的机器翻译实验分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 331.54 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。