-
英文文本高频词汇统计数据集EnglishTextHigh-FrequencyWordStatistics-linawolf
英文文本高频词汇统计数据集EnglishTextHigh-FrequencyWordStatistics-linawolf 数据来源:互联网公开数据 标签:文本分析, 词频统计, 英语, 语料库, 自然语言处理, 数据可视化, 语言学, 词汇 数据概述:... -
文本可读性评估测试数据集TextReadabilityAssessmentTestDataset-teeyee314
文本可读性评估测试数据集TextReadabilityAssessmentTestDataset-teeyee314 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 文本理解, 教育, 语言学, 机器学习, 语料库 数据概述: 该数据集包含来自CommonLit Readability... -
语言学习者口语能力评估数据集LanguageLearnerSpokenProficiencyAssessmentDataset-dhawalsakharwade
语言学习者口语能力评估数据集LanguageLearnerSpokenProficiencyAssessmentDataset-dhawalsakharwade 数据来源:互联网公开数据 标签:语言学习, 口语评估, 语言学, 多语言, 学习者表现, 数据分析, 机器学习, 语言能力 数据概述:... -
TED演讲西班牙语字幕文本数据集TEDTalksSpanishSubtitles-criscastromaya
TED演讲西班牙语字幕文本数据集TEDTalksSpanishSubtitles-criscastromaya 数据来源:互联网公开数据 标签:TED演讲, 西班牙语, 字幕, 文本分析, 自然语言处理, 语料库, 语言学, 文本挖掘 数据概述: 该数据集包含来自TED演讲的西班牙语字幕文本,记录了演讲者的演讲内容。主要特征如下:... -
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语料库, 机器翻译, 自然语言处理, 文本匹配, 语言学, 数据标注 数据概述: 该数据集包含来自不同语言的文本对,记录了文本对之间的相似度评分。主要特征如下:... -
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi 数据来源:互联网公开数据 标签:文本分析, 西班牙语, 评论数据, 情感分析, 自然语言处理, 语料库, 文本挖掘, 语言学 数据概述: 该数据集包含来自公开渠道的西班牙语评论文本,记录了用户对不同主题的评论内容。主要特征如下:... -
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 文本翻译, 英语, 泰卢固语, 自然语言处理, 平行语料 数据概述: 该数据集包含英语与泰卢固语的平行文本,记录了两种语言之间的翻译对应关系。主要特征如下:... -
多语言数字词汇对照数据集MultilingualNumberVocabularyDataset-shubhamprakash778
多语言数字词汇对照数据集MultilingualNumberVocabularyDataset-shubhamprakash778 数据来源:互联网公开数据 标签:多语言, 数字, 词汇对照, 语言学, 文本分析, 印度语系, 词典, 语言学习 数据概述:... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 文本分析, 语言学, 语料库, 文本语料, 机器学习 数据概述:... -
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297 数据来源:互联网公开数据 标签:努佩语, 古兰经, 翻译, 语言学, 文本分析, 跨语言, 宗教, 语义分析 数据概述: 该数据集包含古兰经的英文和努佩语(Nupe)翻译,记录了古兰经经文的跨语言对照。主要特征如下:... -
乌尔都语评论情感分析数据集UrduReviewsSentimentAnalysisDataset-favadhassanjaskani
乌尔都语评论情感分析数据集UrduReviewsSentimentAnalysisDataset-favadhassanjaskani 数据来源:互联网公开数据 标签:情感分析,乌尔都语,文本分类,自然语言处理,情感标注,评论数据,机器学习,语言学 数据概述:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 机器翻译, 情感分析, 文本匹配, 语言学, 深度学习 数据概述: 该数据集包含来自tylermeier-... -
尼日利亚努佩语单语语料库数据集NupeMonolingualCorpus-davidvictor297
尼日利亚努佩语单语语料库数据集NupeMonolingualCorpus-davidvictor297 数据来源:互联网公开数据 标签:语言学, 语料库, 努佩语, 自然语言处理, 文本分析, 语言资源, 文本语料, 尼日利亚 数据概述:... -
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-azzaal
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-azzaal 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 自然语言处理, 语言学, 机器学习, 语料库, 情感极性 数据概述:... -
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva 数据来源:互联网公开数据 标签:机器翻译, 文本评估, 翻译质量, 文本分析, 语言学, 自然语言处理, 评估指标, 对比分析 数据概述:... -
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:... -
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 语言对, 曼西语, 俄语, 语料库, 自然语言处理 数据概述: 该数据集包含曼西语和俄语的双语平行文本,旨在为机器翻译、语言研究等领域提供数据支持。主要特征如下:... -
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing 数据来源:互联网公开数据 标签:文本纠错, 机器翻译, 语言学, 自然语言处理, 文本匹配, 语料库, 数据清洗, 英语学习 数据概述:... -
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 米佐语, 自然语言处理, 语言学, 机器学习, 情感分析, 语料库 数据概述: 该数据集包含来自互联网的米佐语新闻文章,记录了不同主题的新闻内容,用于文本分类任务。主要特征如下:... -
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音转录, 地理位置, 数据标注, 语音数据, 语言学, 机器学习 数据概述: 该数据集包含来自孟加拉地区的孟加拉语语音转录数据,记录了不同地点的语音转录文本。主要特征如下:...