-
孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi
孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi 数据来源:互联网公开数据 标签:孟加拉语,词形还原,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自孟加拉语书籍的词形还原数据,记录了孟加拉语文本中单词的词形还原结果。主要特征如下:... -
英语高频词汇统计数据集-sudosharma
英语高频词汇统计数据集-sudosharma 数据来源:互联网公开数据 标签:英语,词汇,数据集,语言学,频率分析,自然语言处理,文本分析,词频统计 数据概述:该数据集包含了英语中出现频率最高的一批词汇,记录了这些词汇及其对应的出现频率。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于语料库的更新。 地理范围:数据覆盖范围为英语通用语料库。... -
拉丁与西里尔字母数据集LatinandCyrillicLettersDataset-oleksiichornyi
拉丁与西里尔字母数据集LatinandCyrillicLettersDataset-oleksiichornyi 数据来源:互联网公开数据 标签:拉丁字母, 西里尔字母, 数据集, 字母识别, 机器学习, 文字处理, 文化研究, 语言学 数据概述: 该数据集包含拉丁字母和西里尔字母的数据,记录了两种字母系统中的字母及其相关特征。主要特征如下:... -
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:... -
美国婴儿姓名统计数据集NationalNamesDataset-solarfury
美国婴儿姓名统计数据集NationalNamesDataset-solarfury 数据来源:互联网公开数据 标签:姓名,统计,人口,数据集,性别,文化研究,社会科学,语言学 数据概述: 该数据集包含来自美国社会保障局的婴儿姓名数据,记录了自1880年以来美国新生儿的姓名,性别及年度统计数量。主要特征如下:... -
姓氏数据库BaseofSurnames-vakhrameevsergey
姓氏数据库BaseofSurnames-vakhrameevsergey 数据来源:互联网公开数据 标签:姓氏,人口统计,数据集,社会学,语言学,文化研究,数据分析,姓名学 数据概述: 该数据集包含姓氏相关信息,记录了不同国家和地区的姓氏数据。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各数据源的更新频率。... -
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:... -
肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle
肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle 数据来源:互联网公开数据 标签:手语,数据集,肯尼亚,语言学,图像识别,机器学习,聋人社区,文化研究 数据概述: 该数据集包含肯尼亚手语的视频数据,记录了不同手语词汇和短语的视觉表现。主要特征如下:... -
摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg
摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,阿拉伯语,文本分类,情感分析,机器学习,语言学 数据概述: 该数据集包含摩洛哥阿拉伯语(Darija)文本,用于仇恨言论检测任务。主要特征如下: 时间跨度:... -
古兰经数据集QuranDataDataset-raghadraghad
古兰经数据集QuranDataDataset-raghadraghad 数据来源:互联网公开数据 标签:古兰经,宗教,数据集,文本分析,语言学,文学,语义分析,伊斯兰研究 数据概述: 该数据集包含了古兰经的文本数据,适用于宗教研究,文本分析和语言学研究等任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了古兰经的成书时期及后续版本。... -
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:... -
波斯语数据集PersianDataset-amirali10281
波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。... -
孟加拉语文本情感分析数据集-shadikaafroze
孟加拉语文本情感分析数据集-shadikaafroze 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本数据,孟加拉语,机器学习,情感分类,数据集,语言学 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据收集时间跨度未知,但包含了近期和历史的孟加拉语文本。... -
突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel
突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,突尼斯语,语言学,机器学习,人工智能,文本挖掘 数据概述:该数据集包含来自突尼斯的自然语言处理数据,记录了突尼斯语文本的多方面信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。... -
印度人名数据集IndianNamesDataset-chaitanyapatil7
印度人名数据集IndianNamesDataset-chaitanyapatil7 数据来源:互联网公开数据 标签:人名,印度,数据集,语言学,文化研究,数据挖掘,机器学习,身份识别 数据概述: 该数据集包含来自印度的常见人名数据,记录了印度不同地区,民族和宗教背景下的姓名信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。... -
阿拉伯语文本情感分析数据集-akshat18
阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:... -
英语词汇与定义数据集VAL-EN-DFDataset-bamps53
英语词汇与定义数据集VAL-EN-DFDataset-bamps53 数据来源:互联网公开数据 标签:英语词汇,定义,数据集,自然语言处理,词义消歧,语言学,文本分析,机器学习 数据概述: 该数据集包含了大量的英语词汇及其对应的定义,主要用于自然语言处理和语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。... -
乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir
乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir 数据来源:互联网公开数据 标签:情感分析,自然语言处理,乌尔都语,文本数据,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含乌尔都语文本数据,用于情感分析任务。主要特征如下:... -
印地语-英语混合语言数据集-saahir2629
印地语-英语混合语言数据集-saahir2629 数据来源:互联网公开数据 标签:印地语,英语,混合语言,数据集,自然语言处理,文本分析,机器翻译,语言学 数据概述:该数据集包含印地语和英语混合语言的文本数据,记录了两种语言混合使用的各种场景。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了现代社交媒体和日常交流中的常见用例。... -
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:...