-
语言工具-6数据集LanguageTool-6Dataset-tsobolev
语言工具-6数据集LanguageTool-6Dataset-tsobolev 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,语法检查,机器学习,语义分析,文本纠错 数据概述: 该数据集由语言工具-6项目提供,主要包含用于语言处理的文本数据,适用于文本分析、语法检查等任务。主要特征如下:...
-
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,英语,希伯来语,自然语言处理,文本分析,翻译技术 数据概述: 该数据集包含来自OPUS项目的英语到希伯来语的平行文本数据,记录了大量的英文原文及其对应的希伯来文翻译。主要特征如下:...
-
日英字幕语料库数据集-2020年-onslaught
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:...
-
商品品牌信息俄语数据集ProductBrandInformationRussianDataset-bulbazavril
商品品牌信息俄语数据集ProductBrandInformationRussianDataset-bulbazavril 数据来源:互联网公开数据 标签:商品信息, 品牌识别, 俄语, 文本数据, 数据清洗, 市场分析, 商品分类, 语言处理 数据概述: 该数据集包含来自未知来源的商品品牌信息,记录了商品名称与其对应的品牌。主要特征如下:...
-
乌尔都语情感分析数据集UrduSentimentAnalysisDataset-mohabbatsial
乌尔都语情感分析数据集UrduSentimentAnalysisDataset-mohabbatsial 数据来源:互联网公开数据 标签:情感分析, 乌尔都语, 文本分类, 语言处理, 自然语言处理, 情感极性, 社交媒体, 文本挖掘 数据概述: 该数据集包含源自社交媒体平台的乌尔都语文本数据,记录了用户表达的情感倾向。主要特征如下:...
-
MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh
MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,机器学习,情感分析,学术资源,计算机科学 数据概述: 该数据集包含来自MASC(Minimal Annotated Subcorpus of Canadian...
-
阿姆哈拉语文本数据集AmharicDataDataset-azzaal
阿姆哈拉语文本数据集AmharicDataDataset-azzaal 数据来源:互联网公开数据 标签:阿姆哈拉语,文本数据,数据集,语言处理,自然语言处理,机器学习,多语言,非洲语言 数据概述: 该数据集包含来自公开来源的阿姆哈拉语文本数据,记录了阿姆哈拉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能涵盖多个时间段。...
-
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:...
-
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc 数据来源:互联网公开数据 标签:语言处理,马拉地语,自然语言处理,数据集,文本分析,机器学习,语言翻译,数据挖掘 数据概述: 该数据集包含经过处理的马拉地语文本数据,记录了马拉地语的自然语言文本信息。主要特征如下:...
-
翻译数据数据集TranslationDataDataset-khoahongg
翻译数据数据集TranslationDataDataset-khoahongg 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,跨文化交流,文本分析,人工智能 数据概述: 该数据集包含来自不同语言之间的翻译数据,记录了多种语言文本的翻译对应关系。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
-
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:...
-
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,数据集,自然语言处理,文本分类,机器学习,语言处理,情感计算 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和评论网站的情感分析数据,记录了用户对特定主题或产品的情感表达。主要特征如下:...
-
英文-印地语文本语料库
英文-印地语文本语料库 数据来源:互联网公开数据 标签:英文,印地语,文本语料库,机器翻译,语言处理,平行语料,数据清洗 数据概述: 本数据集包含来自两个公开来源的英文-印地语文本数据。其中,英文-印地语数据集基于印度理工学院孟买分校(IIT...
-
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,翻译质量,英语,泰卢固语,自然语言处理,多语言 数据概述:...
-
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:...
-
阿尔及利亚推文数据集AlgerianTweetsDataset-didamarouane
阿尔及利亚推文数据集AlgerianTweetsDataset-didamarouane 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,情感分析,机器学习,文本挖掘,语言处理,情感研究 数据概述: 该数据集包含来自阿尔及利亚地区推文数据,记录了社交媒体上用户发布的内容。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
-
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007 数据来源:互联网公开数据 标签:语言处理,拼写检查,数据集,自然语言处理,机器学习,纠错算法,文本分析,语言技术 数据概述:...
-
Facebook用户评论数据集FacebookUserCommentDataset-snnguyn310
Facebook用户评论数据集FacebookUserCommentDataset-snnguyn310 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,文本挖掘,情感分析,机器学习,用户行为,语言处理 数据概述:该数据集包含来自Facebook平台的用户评论数据,记录了用户在社交媒体上的互动内容。主要特征如下:...
-
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,语言处理,孟加拉语,分类算法 数据概述: 该数据集包含来自孟加拉语新闻网站的数据,记录了各类新闻文章的文本内容和分类标签。主要特征如下:...
-
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:...



