-
推特-趣味事实-推文内容分析数据集英文
推特-趣味事实-推文内容分析数据集英文 数据来源:互联网公开数据 标签:推特,社交媒体,趣味事实,推文,内容分析,语言学,信息传播,英语 数据概述: 本数据集收录了推特(Twitter)上所有包含短语“Fun...
-
尼泊尔普拉吉特文字手写文本数据集-svarnimn
尼泊尔普拉吉特文字手写文本数据集-svarnimn 数据来源:互联网公开数据 标签:尼泊尔语,普拉吉特文字,手写文本,语言学,文化遗产,文本分析,历史文献,文字识别 数据概述:...
-
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源:互联网公开数据 标签:语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集 数据概述:...
-
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-ivanblch
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-ivanblch 数据来源:互联网公开数据 标签:语言校对, 语法检查, 词汇纠错, 自然语言处理, 文本分析, 语言学, 规则库, 机器学习 数据概述:...
-
俄罗斯Telegram频道文章文本与主题分类数据集
俄罗斯Telegram频道文章文本与主题分类数据集 数据来源:互联网公开数据 标签:Telegram,社交媒体,俄罗斯,文本分析,主题分类,语言学,舆情分析,新闻,政治 数据概述: 本数据集包含了俄罗斯语Telegram频道帖子的标注文本。数据的主要组成部分是帖子的文本内容以及对应的主题分类标签。 数据用途概述:...
-
老挝语-越南语机器翻译语料库越南语文本数据集-zuydang
老挝语-越南语机器翻译语料库越南语文本数据集-zuydang 数据来源:互联网公开数据 标签:机器翻译,语料库,老挝语,越南语,文本,语言学,自然语言处理,ALT 数据概述: 本数据集是从ALT(亚洲语言技术)项目中提取的老挝语-...
-
法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024
法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024 数据来源:互联网公开数据 标签:法国说唱,歌词,文本分析,音乐,语言学,文化研究,RapGenius,嘻哈 数据概述:...
-
孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder
孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder 数据来源:互联网公开数据 标签:文本分割, 孟加拉语, 自然语言处理, 语料库, 文本分析, 机器翻译, 数据标注, 语言学 数据概述: 该数据集包含孟加拉语文本,记录了用于训练和评估文本分割模型的数据。主要特征如下:...
-
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 写作评估, 语言模型, 文本质量, 机器学习, 文本评分, 语言学 数据概述: 该数据集包含用于评估英语写作质量的相关数据,涵盖了文本评估的多个维度。主要特征如下:...
-
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:...
-
白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys
白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys 数据来源:互联网公开数据 标签:语音识别, 声学模型, 语音合成, 文本转录, 语言学, 白俄罗斯语, 语音数据, 数据集 数据概述: 该数据集包含来自互联网的白俄罗斯语语音数据,记录了白俄罗斯语的语音片段及其对应的文本转录。主要特征如下:...
-
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95 数据来源:互联网公开数据 标签:语言校对, 文本纠错, 自然语言处理, 多语言支持, 词汇校正, 语法检查, 数据集, 语言学 数据概述:...
-
芬兰文本语料库2010-2020数据集-haaldrin
芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
-
俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov
俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本分类, 情感极性, 数据标注, 机器学习, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同来源的俄语文本数据,旨在用于情感分析任务。主要特征如下:...
-
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja 数据来源:互联网公开数据 标签:维基百科,泰卢固语,文本分析,自然语言处理,数据集,语言学,信息检索,文本挖掘 数据概述: 该数据集包含来自泰卢固语维基百科的文章数据,记录了泰卢固语维基百科中所有文章的详细信息。主要特征如下:...
-
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 平行语料, 越南语, 西班牙语, 语言学, 自然语言处理, 语料库, 文本对齐 数据概述: 该数据集包含越南语和西班牙语的平行文本对,记录了两种语言的对应翻译示例。主要特征如下:...
-
孟加拉语语音识别训练元数据数据集-imtiazprio
孟加拉语语音识别训练元数据数据集-imtiazprio 数据来源:互联网公开数据 标签:语音识别,数据集,孟加拉语,语音数据,自然语言处理,声学模型,机器学习,语言学 数据概述: 该数据集包含孟加拉语语音识别训练的元数据信息,记录了用于训练语音识别模型的相关数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,但通常涵盖了语音识别研究的最新进展。...
-
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid 数据来源:互联网公开数据 标签:机器翻译,Transformer,数据集,自然语言处理,深度学习,语言学,人工智能,文本分析...
-
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:...
-
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...



