-
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta 数据来源:互联网公开数据 标签:俚语, 缩写, 社交媒体, 文本分析, 自然语言处理, 语料库, 语言学, 数据挖掘 数据概述: 该数据集包含来自社交媒体平台的俚语缩写及其对应的完整释义。主要特征如下:... -
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 语料库, 自然语言处理, 双语对照 数据概述:... -
越南语情感语音识别数据集VietnameseEmotionalSpeechRecognitionDataset-sontrancao
越南语情感语音识别数据集VietnameseEmotionalSpeechRecognitionDataset-sontrancao 数据来源:互联网公开数据 标签:语音识别, 情感分析, 越南语, 声学模型, 语音情感, 数据标注, 语言学, 机器学习 数据概述:... -
多语言数字对照数据集MultilingualNumberCorrespondenceDataset-shubhamprakash778
多语言数字对照数据集MultilingualNumberCorrespondenceDataset-shubhamprakash778 数据来源:互联网公开数据 标签:多语言, 数字, 语言学, 翻译, 文本分析, 词汇对照, 印度语言, 数据集 数据概述:... -
土耳其语恶意文本分类数据集TurkishOffensiveTextClassificationDataset-alaaddinerdindal
土耳其语恶意文本分类数据集TurkishOffensiveTextClassificationDataset-alaaddinerdindal 数据来源:互联网公开数据 标签:土耳其语, 文本分类, 恶意文本, 冒犯性言论, 情感分析, 语言学, 机器学习, 数据标注 数据概述:... -
土耳其语和意大利语习语识别与评价数据集TurkishandItalianIdiomRecognitionandEvaluationDataset-alisentas
土耳其语和意大利语习语识别与评价数据集TurkishandItalianIdiomRecognitionandEvaluationDataset-alisentas 数据来源:互联网公开数据 标签:习语识别, 文本分析, 语言学, 土耳其语, 意大利语, 情感分析, 评价, 机器学习 数据概述:... -
越南喃字词汇与句子数据集VietnameseNomCharacterVocabularyandSentences-dktahuio
越南喃字词汇与句子数据集VietnameseNomCharacterVocabularyandSentences-dktahuio 数据来源:互联网公开数据 标签:喃字, 越南语, 词汇, 句子, 语言学, 文本分析, 古籍, 历史文献 数据概述:... -
英语词频统计数据集EnglishWordFrequencyStatistics-takashitahara
英语词频统计数据集EnglishWordFrequencyStatistics-takashitahara 数据来源:互联网公开数据 标签:词频统计, 文本分析, 英语, 自然语言处理, 语料库, 语言学, 单词频率, 数据挖掘 数据概述: 该数据集包含来自互联网公开数据的英语单词词频统计信息,记录了大量英语单词及其出现的频率。主要特征如下:... -
Leet文本转换词汇数据集LeetTextConversionVocabularyDataset-joshuajacobs2
Leet文本转换词汇数据集LeetTextConversionVocabularyDataset-joshuajacobs2 数据来源:互联网公开数据 标签:Leet, 文本转换, 词汇, 网络语言, 数据清洗, 自然语言处理, 文本分析, 语言学 数据概述:... -
土耳其语人名识别数据集TurkishPersonNameRecognitionDataset-adnanankaral
土耳其语人名识别数据集TurkishPersonNameRecognitionDataset-adnanankaral 数据来源:互联网公开数据 标签:人名识别,自然语言处理,文本标注,命名实体识别,土耳其语,机器学习,文本分类,语言学 数据概述: 该数据集包含土耳其语人名文本数据,用于训练和评估人名识别模型。主要特征如下:... -
文本语料库搭配与词频分析数据集TextCorpusCollocationandFrequencyAnalysis-esrapolat
文本语料库搭配与词频分析数据集TextCorpusCollocationandFrequencyAnalysis-esrapolat 数据来源:互联网公开数据 标签:文本分析, 语料库, 词频统计, 搭配关系, 自然语言处理, 文本挖掘, 语言学, 词汇学 数据概述:... -
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 中文, 英文, 翻译模型, 双语语料库, 自然语言处理 数据概述: 该数据集包含中英双语的短语句对,记录了英文短语及其对应的中文翻译。主要特征如下:... -
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 文本匹配, 语篇分析, 机器翻译, 深度学习, 语言学 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本对齐, 语言学, 自然语言处理, 双语数据 数据概述: 该数据集包含印地语和英语的双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
孟加拉谚语语义理解数据集BengaliProverbsSemanticUnderstanding-ghazalismydaughter
孟加拉谚语语义理解数据集BengaliProverbsSemanticUnderstanding-ghazalismydaughter 数据来源:互联网公开数据 标签:谚语, 孟加拉语, 语义分析, 文本理解, 情感分析, 语言学, 数据标注, 自然语言处理 数据概述:... -
印地语语音合成数据集HindiSpeechSynthesisDataset-sarty077
印地语语音合成数据集HindiSpeechSynthesisDataset-sarty077 数据来源:互联网公开数据 标签:语音合成, 文本转语音, 印地语, 音频数据, 语言学, 深度学习, 语音识别, 声学模型 数据概述: 该数据集包含印地语的语音和对应的文本数据,旨在用于语音合成(TTS)模型的训练和评估。主要特征如下:... -
阿富汗普什图语文本情感分析数据集AfghanistanPashtoTextSentimentAnalysis-pashtoaesthetic
阿富汗普什图语文本情感分析数据集AfghanistanPashtoTextSentimentAnalysis-pashtoaesthetic 数据来源:互联网公开数据 标签:情感分析, 普什图语, 文本分类, 语言学, 阿富汗, 机器学习, 自然语言处理, 情感标注 数据概述:... -
印尼谚语隐喻识别数据集IndonesianProverbsFigurativeRecognitionDataset-namazifard
印尼谚语隐喻识别数据集IndonesianProverbsFigurativeRecognitionDataset-namazifard 数据来源:互联网公开数据 标签:谚语, 隐喻, 自然语言处理, 文本分类, 语义理解, 印尼语, 语料库, 语言学 数据概述:... -
斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-rayaneratiarivelo
斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-rayaneratiarivelo 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 斯瓦希里语, 多标签分类, 自然语言处理, 语言学, 机器学习, 语料库 数据概述:... -
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 文本分析, 语言学, 词汇, 语料库, 机器翻译 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,用于训练和评估孟加拉语词形还原模型。主要特征如下:...