-
土耳其政治词汇数据集TurkishPoliticalVocabularyDataset-mythereus
土耳其政治词汇数据集TurkishPoliticalVocabularyDataset-mythereus 数据来源:互联网公开数据 标签:政治学,词汇分析,数据集,语言学,机器学习,文本挖掘,社会科学,政治研究 数据概述: 该数据集包含来自土耳其政治领域的词汇数据,记录了政治文献,新闻和公开演讲中的关键词汇。主要特征如下:... -
文本转国际音标训练集TexttoIPAMappingTrainset-jakir57
文本转国际音标训练集TexttoIPAMappingTrainset-jakir57 数据来源:互联网公开数据 标签:文本转音标,数据集,语音识别,自然语言处理,机器学习,语言学,音标转换,人工智能 数据概述:... -
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:孟加拉语,罗马字,转写,数据集,自然语言处理,语言学,机器学习,文本分析 数据概述:... -
古兰经阿拉伯语章节数据集-haykelbargougui
古兰经阿拉伯语章节数据集-haykelbargougui 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,文本数据,宗教,伊斯兰教,自然语言处理,文本分析,语言学 数据概述: 该数据集包含古兰经的阿拉伯语文本数据,记录了古兰经的各个章节及其对应的经文。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容,即从古兰经的创作时期至今。... -
日语汉字字符数据集-ameltouati
日语汉字字符数据集-ameltouati 数据来源:互联网公开数据 标签:日语,汉字,字符识别,语言学,数据集,图像处理,机器学习,文字分析 数据概述: 该数据集包含了日语汉字字符的图像数据,旨在用于汉字识别,语言研究等任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了现代日语汉字的使用。... -
古兰经沃洛夫语-法语翻译数据集AlxuraanWolof-FrenchDataset-cibfaye
古兰经沃洛夫语-法语翻译数据集AlxuraanWolof-FrenchDataset-cibfaye 数据来源:互联网公开数据 标签:古兰经,沃洛夫语,法语,翻译,语言学,自然语言处理,数据集,跨语言 数据概述: 该数据集包含古兰经的沃洛夫语和法语翻译文本,旨在为语言学研究和跨语言文本分析提供资源。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容。... -
希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray
希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray 数据来源:互联网公开数据 标签:希伯来语,情感分析,文本数据,自然语言处理,机器学习,语言学,数据集,NLP 数据概述: 该数据集包含来自互联网的希伯来语文本数据,用于情感分析任务。主要特征如下: 时间跨度:... -
Bootstrap100问题200题集语气变化数据集20240319-asalan
Bootstrap100问题200题集语气变化数据集20240319-asalan 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,语气识别,机器学习,文本挖掘,语言学,数据分析 数据概述:该数据集包含来自Bootstrap项目的100个问题,每个问题有200个不同语气变化的题集记录,适用于语气识别和文本分析等任务。主要特征如下:... -
阿拉伯语拼写数据集SpellArabicDataset-twproject
阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:... -
社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas
社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:... -
阿萨姆语女声语音数据集-miralmaradiya
阿萨姆语女声语音数据集-miralmaradiya 数据来源:互联网公开数据 标签:语音识别,数据集,语音合成,阿萨姆语,自然语言处理,声学模型,语言学,音频数据 数据概述:该数据集包含阿萨姆语女声的语音数据,记录了不同说话者朗读的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不确定,具体取决于数据集的构建时间。... -
罗塞塔石碑数据集RosettaSetDataset-iezepov
罗塞塔石碑数据集RosettaSetDataset-iezepov 数据来源:互联网公开数据 标签:古埃及,象形文字,罗塞塔石碑,语言学,翻译,数据集,历史,文化遗产 数据概述: 该数据集包含与罗塞塔石碑相关的数据,主要记录了石碑上的三种文字(古希腊文,世俗体,象形文字)的对照信息。主要特征如下:... -
手写波斯数字识别数据集HandwrittenPersianNumeralsRecognitionDataset-kushasabzevari
手写波斯数字识别数据集HandwrittenPersianNumeralsRecognitionDataset-kushasabzevari 数据来源:互联网公开数据 标签:手写识别,波斯数字,数据集,图像分析,机器学习,视觉识别,人工智能,语言学 数据概述:该数据集包含来自多个来源的手写波斯数字图像,记录了波斯数字0到9的手写样本。主要特征如下:... -
阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune
阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯文化,民间故事,文本分析,自然语言处理,情感分析,语言学,文化研究,叙事学 数据概述:该数据集包含来自Raid项目收集的阿拉伯民间故事,记录了阿拉伯地区的各种民间故事和传说。主要特征如下:... -
俄罗斯诗歌数据集RussianPoetryDataset-mira318
俄罗斯诗歌数据集RussianPoetryDataset-mira318 数据来源:互联网公开数据 标签:诗歌,文学,俄语,数据集,文本分析,自然语言处理,文化研究,语言学 数据概述: 该数据集包含来自俄罗斯的诗歌作品,收录了不同时期,不同作者的诗歌,旨在为研究俄罗斯文学和语言提供数据支持。主要特征如下:... -
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany
摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany 数据来源:互联网公开数据 标签:语言学,方言研究,数据集,语音识别,自然语言处理,非洲文化,机器学习,语言分析 数据概述: 该数据集包含来自摩洛哥的方言语音和文本数据,记录了摩洛哥方言的发音,词汇和语法特征。主要特征如下:... -
英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya
英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,平行语料,语言学,文本分析 数据概述: 该数据集包含了英语和印地语的平行文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong
情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong 数据来源:互联网公开数据 标签:情绪词汇,数据集,自然语言处理,文本分析,情感计算,社会心理学,机器学习,语言学 数据概述: 该数据集包含来自多个来源的情绪词汇,记录了不同词汇对应的情绪类别及其相关特征。主要特征如下:... -
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:... -
图卢维基百科数据转储2023年数据集-moreducks
图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...