-
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-icode100
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-icode100 数据来源:互联网公开数据 标签:自然语言处理, 词性标注, 泰卢固语, 语言学, 文本分析, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含泰卢固语文本,记录了每个词语及其对应的词性标签。主要特征如下:... -
英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh
英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 双语语料库, 文本数据, 自然语言处理, 翻译模型, 语言对, 语料分析 数据概述: 该数据集包含英法双语短语翻译数据,记录了英语短语及其对应的法语翻译。主要特征如下:... -
越南语10万句数据集-duongtrunghien
越南语10万句数据集-duongtrunghien 数据来源:互联网公开数据 标签:越南语,数据集,自然语言处理,文本分析,机器翻译,语言学,文本语料库,NLP 数据概述: 该数据集包含约10万句越南语文本,涵盖了多种主题和语体。主要特征如下: 时间跨度:数据无明确的时间范围,主要反映现代越南语的使用情况。... -
泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135
泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135 数据来源:互联网公开数据 标签:机器翻译, 泰卢固语, 语言学, 文本数据, 自然语言处理, 翻译模型, 双语对照, 数据集 数据概述: 该数据集包含泰卢固语的文本翻译数据,记录了泰卢固语词汇或短语及其对应的翻译。主要特征如下:... -
僧伽罗语对话数据集SinhalaDialogueDataset-preminda
僧伽罗语对话数据集SinhalaDialogueDataset-preminda 数据来源:互联网公开数据 标签:僧伽罗语, 文本数据, 对话语料, 语言学, 自然语言处理, 文本分析, 语料库, 机器学习 数据概述: 该数据集包含来自公开渠道的僧伽罗语对话文本,记录了不同场景下的对话内容。主要特征如下:... -
孟加拉语语料库2022数据集-srjony
孟加拉语语料库2022数据集-srjony 数据来源:互联网公开数据 标签:孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言学,学术研究,数据集 数据概述:该数据集包含来自多个来源的孟加拉语文本数据,记录了广泛的孟加拉语语料,适用于自然语言处理、文本分析等任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本对齐, 语言学, 俄语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的英俄平行语料,记录了英语句子及其对应的俄语翻译。主要特征如下:... -
法语文本翻译数据集FrenchTextTranslation-aadiwalid
法语文本翻译数据集FrenchTextTranslation-aadiwalid 数据来源:互联网公开数据 标签:机器翻译, 法语, 文本数据, 自然语言处理, 语料库, 语言学, 数据分析, 翻译模型 数据概述: 该数据集包含来自互联网的法语文本片段,主要用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
印尼语词义标注语料一致性分析数据集IndonesianWordSenseAnnotationAgreementAnalysisDataset-misael...
印尼语词义标注语料一致性分析数据集IndonesianWordSenseAnnotationAgreementAnalysisDataset-misaeljonathann 数据来源:互联网公开数据 标签:词义消歧, 自然语言处理, 语料库, 标注数据, 一致性分析, 语言学, 文本分析, 印尼语 数据概述:... -
孟加拉语语音识别模型评估数据集BengaliSpeechRecognitionModelEvaluationDataset-mbmmurad
孟加拉语语音识别模型评估数据集BengaliSpeechRecognitionModelEvaluationDataset-mbmmurad 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音转录, 文本校对, 模型评估, 语言学, 机器学习, 语音数据 数据概述: 该数据集包含来自Common... -
词汇关系与语言结构分析数据集LexicalRelationandLinguisticStructureAnalysisDataset-iglikastoupak
词汇关系与语言结构分析数据集LexicalRelationandLinguisticStructureAnalysisDataset-iglikastoupak 数据来源:互联网公开数据 标签:词汇关系, 语言学, 词典学, 文本分析, 自然语言处理, 语义分析, 数据集, 语料库 数据概述:... -
乌尔都语语音转录数据集UrduSpeechTranscriptionDataset-musab00
乌尔都语语音转录数据集UrduSpeechTranscriptionDataset-musab00 数据来源:互联网公开数据 标签:语音识别, 乌尔都语, 语音转录, 文本分析, 语言学, 语音数据, 多模态, 语料库 数据概述: 该数据集包含来自公共语音项目的数据,记录了乌尔都语的语音转录文本。主要特征如下:... -
文本清洗语料数据集TextCleaningCorpus-tayyabhussain7
文本清洗语料数据集TextCleaningCorpus-tayyabhussain7 数据来源:互联网公开数据 标签:文本清洗, 自然语言处理, 数据预处理, 语料库, 文本数据, 数据清洗, 文本分析, 语言学 数据概述: 该数据集包含经过清洗的文本数据,记录了用于文本预处理和分析的语料。主要特征如下:... -
英语写作水平评估文本数据集EnglishWritingProficiencyAssessmentTexts-shunsukemaki
英语写作水平评估文本数据集EnglishWritingProficiencyAssessmentTexts-shunsukemaki 数据来源:互联网公开数据 标签:文本评估, 写作能力, 语言学, 英语学习, 自然语言处理, 文本分析, 机器学习, 语篇质量 数据概述:... -
多源英文文本语句数据集Multi-sourceEnglishTextSentenceDataset-mfekadu
多源英文文本语句数据集Multi-sourceEnglishTextSentenceDataset-mfekadu 数据来源:互联网公开数据 标签:文本数据, 英文语句, 语料库, 自然语言处理, 文本分析, 句子, 语言学, 数据集 数据概述: 该数据集包含来自多个来源的英文文本语句,旨在为自然语言处理任务提供多样化的语料支持。主要特征如下:... -
手语识别训练文本数据集SignLanguageRecognitionTrainingTextDataset-amijjlee
手语识别训练文本数据集SignLanguageRecognitionTrainingTextDataset-amijjlee 数据来源:互联网公开数据 标签:手语识别, 文本数据, 机器学习, 语音识别, 计算机视觉, 序列标注, 数据标注, 语言学 数据概述: 该数据集包含用于手语识别任务的训练文本数据,记录了手语对应的文本短语。主要特征如下:... -
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-rafihassan
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-rafihassan 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 语音学, 声学, 数据标注, 自然语言处理 数据概述:... -
斯瓦希里语语料库数据集-kariukiandrew
斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。... -
白俄罗斯语诗歌情感分析数据集BelarusianPoetrySentimentAnalysis-aliaksandrak
白俄罗斯语诗歌情感分析数据集BelarusianPoetrySentimentAnalysis-aliaksandrak 数据来源:互联网公开数据 标签:诗歌, 白俄罗斯语, 情感分析, 文本分析, 自然语言处理, 语言学, 文化研究, 诗歌鉴赏 数据概述:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:...