-
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 矛盾检测, 多语言, 文本分类, 机器翻译, 语言学, 阿拉伯语 数据概述:... -
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 马达加斯加语, 语言学, 文本分析, 语料库, 机器学习, 语言模型 数据概述: 该数据集包含马达加斯加语的词性标注数据,记录了单词及其对应的词性标签。主要特征如下:... -
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 孟加拉语, 自然语言处理, 文本分析, 语言学, 文本预处理, 机器翻译, 词干提取 数据概述: 该数据集包含孟加拉语文本的词形还原数据,旨在为孟加拉语文本处理任务提供支持。主要特征如下:... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 语言学, 文本分析, 语料库, 标注数据, 机器学习 数据概述:... -
孟加拉语仇恨言论文本分类数据集BengaliHateSpeechTextClassificationDataset-asifabdullah
孟加拉语仇恨言论文本分类数据集BengaliHateSpeechTextClassificationDataset-asifabdullah 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 自然语言处理, 孟加拉语, 情感分析, 恶意文本检测, 多标签分类, 语言学 数据概述:... -
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:... -
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:文本纠错, 孟加拉语, 自然语言处理, 语言学, 错误检测, 数据清洗, 机器学习, 语料库 数据概述: 该数据集包含孟加拉语文本的纠错示例,记录了原始(错误)文本及其对应的正确文本。主要特征如下:... -
莎士比亚戏剧哈姆雷特英阿双语对白数据集Shakespeare-sHamletBilingualDialogue-mothecarpenter
莎士比亚戏剧哈姆雷特英阿双语对白数据集Shakespeare-sHamletBilingualDialogue-mothecarpenter 数据来源:互联网公开数据 标签:莎士比亚, 戏剧, 文本对齐, 双语语料库, 阿拉伯语, 英语, 语言学, 文本分析 数据概述:... -
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 国际音标, 文本处理, 自然语言处理, 声学模型 数据概述:... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自互联网的印地语-英语双语文本,记录了印地语句子及其对应的英语翻译。主要特征如下:... -
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自公开来源的印地语-英语双语文本,记录了印地语文本及其对应的英语翻译。主要特征如下:... -
-
印尼语-英语1千词汇对照数据集-imroze
印尼语-英语1千词汇对照数据集-imroze 数据来源:互联网公开数据 标签:印尼语,英语,词汇,翻译,语言学,数据集,自然语言处理,双语词典 数据概述: 该数据集包含1000个印尼语单词及其对应的英语翻译。主要特征如下: 时间跨度:数据记录的时间范围为不确定,基于词汇的收集和整理。 地理范围:数据主要涉及印尼语和英语,涵盖印尼语常用词汇。... -
阿拉伯语方言数据集ArabiziDialectDataset-samawel97
阿拉伯语方言数据集ArabiziDialectDataset-samawel97 数据来源:互联网公开数据 标签:阿拉伯语,方言,语言学,数据集,文本分析,自然语言处理,机器学习,文化研究 数据概述:该数据集包含来自多个阿拉伯语国家和地区的信息,记录了阿拉伯语方言(Arabizi)的文本数据。主要特征如下:... -
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:... -
古兰经翻译阿塞拜疆语数据集TranslationoftheKoranintoAzerbaijaniDataset-vrashad
古兰经翻译阿塞拜疆语数据集TranslationoftheKoranintoAzerbaijaniDataset-vrashad 数据来源:互联网公开数据 标签:古兰经,翻译,阿塞拜疆语,宗教文本,数据集,语言学,文化研究,文本分析 数据概述:... -
常见拼写错误纠正数据集-therahasya00
常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。... -
巴西原住民语言词汇翻译数据集-joscaro
巴西原住民语言词汇翻译数据集-joscaro 数据来源:互联网公开数据 标签:语言学,原住民语言,词汇翻译,数据集,文化研究,自然语言处理,词典编纂,巴西 数据概述: 该数据集包含来自巴西原住民语言的词汇及其对应的翻译。主要特征如下: 时间跨度:数据记录的时间跨度取决于各语言的收集时间,涵盖不同时期。... -
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat 数据来源:互联网公开数据 标签:情感分析,越南语,自然语言处理,文本分类,机器学习,情感极性,数据集,语言学 数据概述:该数据集包含来自越南语文本的情感标注数据,主要用于情感分析任务。主要特征如下:... -
摩洛哥达里贾语情感分析数据集-tariklemkadem
摩洛哥达里贾语情感分析数据集-tariklemkadem 数据来源:互联网公开数据 标签:情感分析,达里贾语,自然语言处理,文本挖掘,数据集,机器学习,摩洛哥文化,语言学 数据概述: 该数据集包含了摩洛哥达里贾语文本数据,用于情感分析任务。主要特征如下: 时间跨度: 数据集未明确标注具体的时间跨度,但数据采集的时间与摩洛哥社交媒体的活跃时间相关。...