-
翻译数据集TranslatedDataset-waelfezari
翻译数据集TranslatedDataset-waelfezari 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,文本分析,语言学,多语言,深度学习,文本对齐 数据概述: 该数据集包含多种语言的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的创建时间。... -
乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani
乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,罗马转写,文本分析,机器学习,语言学,文本数据,情感分析 数据概述: 该数据集包含乌尔都语的罗马转写文本数据,记录了用罗马字母书写的乌尔都语内容。主要特征如下:... -
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,人工智能,翻译技术,语言学,文本分析 数据概述: 该数据集包含多语言机器翻译模型MT5的翻译结果,记录了多种语言之间的翻译准确性,速度和质量。主要特征如下:... -
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna 数据来源:互联网公开数据 标签:语言学,翻译,数据集,自然语言处理,文本转换,莎士比亚,机器学习,文本分析 数据概述: 该数据集旨在提供现代英语到莎士比亚英语的翻译对,用于训练和评估翻译模型。主要特征如下:... -
阿拉伯语文本数据集-mogazeyalmogazey
阿拉伯语文本数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,自然语言处理,语言学,情感分析,机器翻译,文本挖掘,阿拉伯文化 数据概述: 该数据集包含大量阿拉伯语文本数据,涵盖了多种来源和主题。主要特征如下:... -
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar 数据来源:互联网公开数据 标签:文本摘要评估,自然语言处理,数据集,机器学习,信息检索,学术研究,语言学,文本分析... -
罗曼诗歌数据集RomanPoetryDataset-mustafa2003
罗曼诗歌数据集RomanPoetryDataset-mustafa2003 数据来源:互联网公开数据 标签:诗歌,文学,数据集,文本分析,语言学,机器翻译,文化研究,古典文学 数据概述: 该数据集包含来自罗马时期的诗歌作品,记录了古罗马诗人创作的经典诗歌。主要特征如下: 时间跨度:数据记录的时间范围从公元前2世纪到公元4世纪。... -
英语到泰卢固语翻译数据集-krizzna69
英语到泰卢固语翻译数据集-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,泰卢固语,英语,自然语言处理,深度学习,翻译模型 数据概述: 该数据集包含英语到泰卢固语的翻译数据,记录了英语句子及其对应的泰卢固语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不限,通常涵盖不同时期和语境下的翻译。... -
亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21
亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。... -
土耳其语-英语和匈牙利语手写数据集-yasiradoan
土耳其语-英语和匈牙利语手写数据集-yasiradoan 数据来源:互联网公开数据 标签:手写识别,数据集,OCR,语言学,深度学习,土耳其语,英语,匈牙利语 数据概述:该数据集包含土耳其语,英语和匈牙利语的手写文本数据,旨在促进跨语言的手写识别研究。主要特征如下: 时间跨度:数据记录的时间范围不详,但包含了多种语言的样本。... -
韩语圣经经典与现代版本对照数据集-rycont
韩语圣经经典与现代版本对照数据集-rycont 数据来源:互联网公开数据 标签:圣经,韩语,语言学,文本分析,数据集,翻译研究,对比分析,文化研究 数据概述:该数据集包含韩语圣经经典版本和现代版本的对照数据,记录了不同翻译版本之间的对应关系。主要特征如下: 时间跨度:数据涵盖了韩语圣经的经典版本和现代版本。 地理范围:数据主要关注韩国及其韩语使用者。... -
旁遮普语情感分析数据集PunjabiEmotionData-sahib12
旁遮普语情感分析数据集PunjabiEmotionData-sahib12 数据来源:互联网公开数据 标签:情感分析,自然语言处理,旁遮普语,数据集,文本分类,机器学习,语言学,印度文化 数据概述: 该数据集包含了旁遮普语的文本数据,标注了相应的情感标签,主要用于情感分析研究。主要特征如下: 时间跨度:... -
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:... -
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:... -
印地语语法学习数据集-donutkashvi
印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。... -
对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla
对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:... -
语言检测数据集LanguageDetectionDataset-trinhtung
语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:... -
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
圣经多语言阿拉伯语-法语数据集-oumarbenlol
圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...