-
英语单词学习数据集EnglishWordLearningDataset-arpitmishra28
英语单词学习数据集EnglishWordLearningDataset-arpitmishra28 数据来源:互联网公开数据 标签:英语学习,词汇,数据集,语言教育,自然语言处理,教育科技,词汇记忆,语言研究 数据概述: 该数据集包含英语单词及其相关信息,旨在为英语学习者提供词汇学习支持。主要特征如下:...
-
形容词列表数据集AdjectivesListDataset-jordansiem
形容词列表数据集AdjectivesListDataset-jordansiem 数据来源:互联网公开数据 标签:词汇,语言研究,数据集,自然语言处理,词典,教育,文本分析,语言学习 数据概述:该数据集包含一个形容词的列表,记录了各种形容词的详细信息。主要特征如下: 时间跨度:数据记录的时间范围未明确,但为现代常用词汇。...
-
英语与印地语混合语料数据集HinglishDataset-saahir2629
英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:...
-
汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki
汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki 数据来源:互联网公开数据 标签:汉字注音,音译数据,历史文献,语言研究,数据集,汉语语言学,古籍数字化,文本分析 数据概述: 该数据集包含源自历史文献的汉字音译与注音数据,记录了汉字在不同历史时期的读音标注和音译信息。主要特征如下:...
-
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源:互联网公开数据 标签:新闻,阿塞拜疆语,数据集,自然语言处理,文本分析,机器学习,新闻挖掘,语言研究 数据概述: 该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章,记录了近年来的新闻内容。主要特征如下:...
-
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:...
-
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:...
-
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph 数据来源:互联网公开数据 标签:自然语言处理,文本分类,多标签分类,越南语,作文分析,机器学习,教育技术,语言研究 数据概述:...
-
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:...
-
英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai
英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,语言研究,文本分类,多语言处理,数据挖掘 数据概述: 该数据集包含英语与印地语混合(Hinglish)的文本数据,主要用于情感分析任务。主要特征如下:...
-
瑞典姓名数据集SvenskaNamnDataset-geeklund
瑞典姓名数据集SvenskaNamnDataset-geeklund 数据来源:互联网公开数据 标签:姓名,人口统计,数据集,语言研究,社会学,数据分析,瑞典,文化研究 数据概述:该数据集包含来自瑞典的姓名数据,记录了瑞典人口中的姓名使用情况。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
-
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban...
-
语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap
语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap 数据来源:互联网公开数据 标签:语音识别,口音分析,数据集,语言研究,机器学习,发音差异,音素分析,语音学 数据概述: 该数据集包含来自语音口音归档项目(Speech Accent...
-
网络语言脏话数据集SwearTotalData-parkgarden
网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
-
方言数据集DialectDataDataset-kitashinwtf
方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
-
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
-
印度手语数据集IndianSignLanguageDataset-sukhanshudukare
印度手语数据集IndianSignLanguageDataset-sukhanshudukare 数据来源:互联网公开数据 标签:印度手语,数据集,手势识别,计算机视觉,图像处理,机器学习,人工智能,语言研究 数据概述: 该数据集包含来自印度手语研究所的公开数据,记录了印度手语的视觉表达和手势动作。主要特征如下:...
-
有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi
有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,文本分类,自然语言处理,社交媒体,深度学习,语言研究 数据概述: 该数据集包含来自互联网上的用户评论数据,主要用于识别和分类有毒评论。主要特征如下:...
-
情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann
情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann 数据来源:互联网公开数据 标签:词汇学,情感分析,俄语,数据集,语言研究,机器学习,情感语言学,自然语言处理 数据概述:...
-
拉丁语语料库数据集CorpusLatinDataset-nerdofdot
拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:...



