-
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula 数据来源:互联网公开数据 标签:斯瓦希里语, 语料库, 元数据, 语言学, 文本分析, 语言资源, 南非, 自然语言处理 数据概述:... -
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai 数据来源:互联网公开数据 标签:机器翻译, 约鲁巴语, 英语, 语言学, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述:... -
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma 数据来源:互联网公开数据 标签:语音识别, 阿萨姆语, 语音转录, 语言学, 语音合成, 文本分析, 声音数据, 数据标注 数据概述:... -
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib 数据来源:互联网公开数据 标签:孟加拉语, 语音学, 语言学, 国际音标, 文本转录, 自然语言处理, 数据集, 语音识别 数据概述:... -
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205 数据来源:互联网公开数据 标签:俄语, 笑话, 文本, 自然语言处理, 语料库, 文本分析, 情感分析, 语言学 数据概述: 该数据集包含来自互联网的俄语笑话文本,记录了各种类型的俄语笑话。主要特征如下: 时间跨度:数据未标明具体时间,视作静态语料数据集使用。... -
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg 数据来源:互联网公开数据 标签:语音学, 词典, 发音, 语音识别, 自然语言处理, 语言学, 音素, 文本分析 数据概述:... -
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf 数据来源:互联网公开数据 标签:日语翻译, 古典文学, 万叶集, 伊势物语, 翻译对比, 语言学, 文本分析, 历史文化 数据概述:... -
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene 数据来源:互联网公开数据 标签:斯瓦希里语, 情感分析, 文本分类, 自然语言处理, 情感词典, 文本数据, 机器学习, 语言学 数据概述:... -
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman 数据来源:互联网公开数据 标签:文本质量, 语言学, 文本相似度, 多语言, 文本处理, 语料库, 数据清洗, 机器学习 数据概述:... -
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui 数据来源:互联网公开数据 标签:机器翻译, 语言学, 中文, 越南语, 翻译对齐, 双语语料库, 自然语言处理, 文本数据 数据概述: 该数据集包含来自互联网的中文与越南语双语对照文本,记录了中文句子及其对应的越南语翻译。主要特征如下:... -
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae 数据来源:互联网公开数据 标签:语音识别, 文本转录, 卢旺达语, 语言学, 自然语言处理, 文本数据, 语料库, 语音数据 数据概述:... -
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 自然语言处理, 情感分析, 社交媒体, 机器学习, 语言学, 语料库 数据概述:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:... -
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本特征, 教育, 语言学, 数据集 数据概述:... -
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109 数据来源:互联网公开数据 标签:语音质量, 孟加拉语, 语音识别, NISQA, 语音评估, 机器学习, 声学分析, 语言学 数据概述: 该数据集包含孟加拉语方言语音数据,并附带了使用NISQA(Non-Intrusive Speech... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 机器翻译, 语义理解, 多语言, 文本匹配, 语言学, 情感分析 数据概述:... -
社交媒体仇恨言论与情绪分析数据集SocialMediaHateSpeechandSentimentAnalysisDataset-rifqilukmansyah381
社交媒体仇恨言论与情绪分析数据集SocialMediaHateSpeechandSentimentAnalysisDataset-rifqilukmansyah381 数据来源:互联网公开数据 标签:仇恨言论, 情绪分析, 社交媒体, 文本分类, 多标签分类, 情感分析, 语言学, 数据标注 数据概述:... -
阿拉伯语情感分析句子分类数据集ArabicSentimentAnalysisSentenceClassificationDataset-alaablue
阿拉伯语情感分析句子分类数据集ArabicSentimentAnalysisSentenceClassificationDataset-alaablue 数据来源:互联网公开数据 标签:阿拉伯语, 情感分析, 文本分类, 情感标注, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
西班牙语文本对比分析数据集SpanishTextComparisonDataset-agmeque
西班牙语文本对比分析数据集SpanishTextComparisonDataset-agmeque 数据来源:互联网公开数据 标签:文本对比, 西班牙语, 文本相似度, 语义分析, 自然语言处理, 语言学, 机器学习, 数据集构建 数据概述: 该数据集包含西班牙语文本对,记录了文本之间的对比关系,主要用于文本相似度分析、语义理解等任务。主要特征如下:... -
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary 数据来源:互联网公开数据 标签:梵语, 语言学, 文本分析, 词汇, 文化研究, 古典语言, 文本挖掘, 印度文化 数据概述: 该数据集包含来自互联网的梵语词汇,记录了梵语单词的文本数据。主要特征如下:...