-
视频级学生在线视频使用与学习分析数据集
2026年2月10日 30 189 55
数据集概述 本数据集包含STEM领域不同大学课程中,学生播放视频格式学习材料的学习分析数据,覆盖十年时间。数据涉及35个视频的40,453个会话、313,724条记录,还包含视频的带时间戳转录文本(含原文及英文翻译),可支持学习分析和教育数据挖掘相关研究与应用。 文件详解 字幕文件(.srt) 文件数量:36个(占比约43.9%)...
-
Bejay_多语言翻译_水主题Tsombiach编织图案数据
2026年1月29日 30 111 78
数据集概述 本数据集包含Bejay创作的以水为主题的Tsombiach编织图案的多语言翻译数据,涉及西班牙语、Kämentza语和英语三种语言。数据集以单一Excel文件形式呈现,无其他目录结构或文件类型,主要用于记录不同语言对编织图案的翻译内容。 文件详解 文件名称:Bejay:Agua:Water-pictograms-...
-
SKOS_Based_警察条例德英荷多语言临时翻译数据
2026年1月31日 30 194 160
数据集概述 本数据集为SKOS格式的警察条例多语言临时翻译数据,包含原始德语、英语及荷兰语版本的SKOS术语翻译内容。德语列表源自Karl Härter与Michael Stolleis的著作,英语列表前四级源自Toomas Kotkas的研究,可用于法律术语标准化及多语言语义网络构建,仅包含一个文件。 文件详解...
-
Iliad_BookOne_多语言翻译词级对齐树库注释数据
2026年1月30日 30 72 46
数据集概述 本数据集包含《伊利亚特》第一卷的波斯语和库尔德语翻译文本,与树库进行词级对齐,并附有Didakta注释及双语词汇表。整合了UD树库和Perseus树库数据,支持古典文学翻译、多语言对齐及词汇研究,共含8个文件。 文件详解 翻译与树库对齐文件 文件名称:Iliad one Treebank (UD and Perseus) with...
-
WOKIE_Based_SKOS叙词表LLM自动化翻译系统支持数据
2026年1月27日 30 68 35
数据集概述 本数据集为WOKIE项目“FAIR in allen Sprachen”的附录数据,包含基于LLM的SKOS叙词表自动化翻译系统相关文件,涉及多语言翻译结果、翻译详情及原始叙词表等内容,共10个文件,用于支持该翻译系统的相关研究与应用。 文件详解 RDF格式文件(80.0%) 文件名称:unesco_reduced_en-...
-
PES_French_translation_Based_物理努力量表法语翻译数据与代码
2026年1月13日 30 94 66
数据集概述 本数据集包含物理努力量表(Physical effort scale)法语翻译相关的数据与代码,共2个文件,无目录结构。数据用于支持该量表的法语版本应用,包含样本文件和代码文件,适用于相关实验场景的样本分析。 文件详解 文件名称:pes_french_effort_scale_sample2.Rmd 文件格式:.rmd 字段映射介绍:R...
-
五月语_越语支_方言文本数据集
2025年12月6日 30 121 41
数据集概述 本数据集包含十二篇五月语(越语支)方言文本,原始内容附有越南语和俄语注释及翻译,现提供俄语转英文的版本。该数据集旨在配合相关英文译著的出版,以电子形式补充纸质书中未收录的文本内容。 文件详解 文件名称: May_vernacular_texts_Babaev&Samarina_Dec2020.pdf 文件格式: PDF (.pdf)...
-
欧盟多语言翻译文本数据集
2025年10月1日 30 148 90
欧盟多语言翻译文本数据集_Multilingual_Translation_Text_Dataset 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 文本数据, 英语, 西班牙语, 意大利语, 文本对齐 数据概述: 该数据集包含来自欧盟官方文档的翻译文本,记录了英语与西班牙语、英语与意大利语之间的对应翻译。主要特征如下:...
-
维基百科标题多语言翻译数据集
2025年5月31日 30 135 95
维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:...
-
多语言翻译数据集Multiple-Languages-TranslatorDataset-rizwanash
2025年5月20日 30 55 22
多语言翻译数据集Multiple-Languages-TranslatorDataset-rizwanash 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,多语言,文本分析,人工智能,翻译技术 数据概述: 该数据集包含来自多个语言翻译平台的数据,记录了不同语言之间的文本翻译记录。主要特征如下:...
-
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751
2025年4月29日 30 106 88
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 文本数据, 越南语, 西班牙语, 英语, 数据集 数据概述:...
-
机器翻译模型数据集TranslationModelDataset-osamaabobakr
2025年4月26日 30 42 1
机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:...
-
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang
2025年4月24日 30 62 16
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
-
多语言翻译标签数据集TagsandTranslationDataset-outlook0
2025年4月24日 30 11 6
多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:...
-
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261
2025年4月24日 30 147 29
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD...
-
多语言平行语料库数据集
2025年4月19日 30 76 44
多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-...
-
高质量多语言翻译数据集
2025年4月17日 30 103 85
高质量多语言翻译数据集 数据来源:互联网公开数据 标签:多语言翻译,机器学习,文本处理,自然语言处理,语言模型,国际业务,跨文化交流 数据概述:...
-
灾害响应消息数据集
2025年4月15日 30 70 39
灾害响应消息数据集 数据来源:互联网公开数据 标签:灾害响应,消息分类,自然灾害,危机管理,数据清洗,多语言翻译,公共安全 数据概述: 本数据集由Figure...



