-
尼泊尔语文本语料库数据集
2025年11月7日 30 139 5
尼泊尔语文本语料库数据集_Nepali_Text_Corpus 数据来源:互联网公开数据 标签:尼泊尔语, 文本语料库, 自然语言处理, 语言学, 文本分析, 语料库构建, 文本挖掘, 语言建模 数据概述: 该数据集包含来自尼泊尔语文本的语料库,记录了尼泊尔语文本的数据。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态语料库。...
-
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong
2025年5月30日 30 127 10
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong 数据来源:互联网公开数据 标签:越南语, 文本语料库, 文本分析, 自然语言处理, 语料库构建, 文本摘要, 词嵌入, 语言模型 数据概述:...
-
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart
2025年5月28日 30 197 82
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart 数据来源:互联网公开数据 标签:命名实体识别, 缩写识别, 文本分析, 自然语言处理, 机器学习, 政府机构, 数据标注, 语料库构建 数据概述:...
-
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan
2025年5月19日 30 102 79
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan 数据来源:互联网公开数据 标签:孟加拉语, 文本语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语料库构建, 文本数据 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种来源的孟加拉语文本片段。主要特征如下:...
-
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather
2025年5月1日 30 97 18
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 语料库构建 数据概述: 该数据集包含俄语和英语的句子对,旨在用于机器翻译模型的训练和评估。主要特征如下:...
-
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah
2025年4月29日 30 170 106
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah 数据来源:互联网公开数据 标签:印尼语, 文本语料库, 自然语言处理, 文本分析, 语言学, 语料库构建, 文本挖掘, 语言模型 数据概述: 该数据集包含来自印尼语文本语料库的数据,记录了印尼语的句子示例。主要特征如下:...



