-
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 维基百科, 自然语言处理, 文本对齐, 语料库, 语言学 数据概述:... -
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:... -
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57 数据来源:互联网公开数据 标签:神经机器翻译,数据集,自然语言处理,机器学习,语言学,多语言,翻译技术,数据驱动 数据概述: 该数据集由布里斯托大学工程技术学院提供,专注于神经机器翻译任务,包含多种语言的平行语料库。主要特征如下:... -
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad 数据来源:互联网公开数据 标签:语音识别, 诺阿卡利语, 语音数据集, 声学模型, 语言学, 文本转录, 语音转文本, 深度学习 数据概述:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:... -
维基百科日语初始解析数据集KawikiInitialParsedDataset-zvikinozadze
维基百科日语初始解析数据集KawikiInitialParsedDataset-zvikinozadze 数据来源:互联网公开数据 标签:维基百科,日语,自然语言处理,数据集,文本分析,语言学,信息检索,文本解析 数据概述: 该数据集包含来自维基百科日语版的数据,记录了维基百科日语条目的初始解析结果。主要特征如下:... -
语音识别与情感分析数据集VCTK-XvectorsDataset-vladimirsydor
语音识别与情感分析数据集VCTK-XvectorsDataset-vladimirsydor 数据来源:互联网公开数据 标签:语音识别,情感分析,数据集,声学特征,深度学习,语音处理,音频分析,语言学 数据概述: 该数据集包含来自VCTK(The CMU Arctic Database for Voice Cloning... -
阿拉伯语文本情感分析数据集-nanorfelixsam
阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。... -
语音合成法语对话数据集SpeechSynthesisFrenchDialogueDataset-canardman
语音合成法语对话数据集SpeechSynthesisFrenchDialogueDataset-canardman 数据来源:互联网公开数据 标签:语音合成, 语音识别, 法语, 文本转语音, 深度学习, 声学模型, 语音数据, 语言学 数据概述:... -
数据3000本翻译成俄语的书籍数据集-dmitrybarsu
3000本翻译成俄语的书籍数据集-dmitrybarsu 数据来源:互联网公开数据 标签:书籍,翻译,俄语,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含3000本已翻译成俄语的书籍文本,涵盖了多种主题和文学体裁。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年代的翻译作品。... -
阿拉伯手语识别数据库ARASLDatabase54kFinal数据集ARASLDatabase54kFinaldataset-medfakhreeddine
阿拉伯手语识别数据库ARASLDatabase54kFinal数据集ARASLDatabase54kFinaldataset-medfakhreeddine 数据来源:互联网公开数据 标签:手语识别,计算机视觉,数据集,深度学习,图像分类,人工智能,多模态,语言学 数据概述: 该数据集是阿拉伯手语识别数据库(ARASL Database 54k... -
手语词汇识别数据集IsolatedSignLanguageAggregationDataset-lonnieqin
手语词汇识别数据集IsolatedSignLanguageAggregationDataset-lonnieqin 数据来源:互联网公开数据 标签:手语,数据集,图像识别,自然语言处理,机器学习,手势识别,人工智能,语言学 数据概述: 该数据集包含手语视频数据,用于手语词汇识别任务。主要特征如下:... -
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14
服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14 数据来源:互联网公开数据 标签:法律文本,可读性分析,数据集,文本处理,自然语言处理,机器学习,语言学,数据分析 数据概述: 该数据集包含来自多个互联网平台的服务条款文本以及相应的可读性评分。主要特征如下:... -
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-... -
数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong
2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:... -
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:... -
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...