-
巴西原住民语言词汇翻译数据集-joscaro
巴西原住民语言词汇翻译数据集-joscaro 数据来源:互联网公开数据 标签:语言学,原住民语言,词汇翻译,数据集,文化研究,自然语言处理,词典编纂,巴西 数据概述: 该数据集包含来自巴西原住民语言的词汇及其对应的翻译。主要特征如下: 时间跨度:数据记录的时间跨度取决于各语言的收集时间,涵盖不同时期。... -
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat 数据来源:互联网公开数据 标签:情感分析,越南语,自然语言处理,文本分类,机器学习,情感极性,数据集,语言学 数据概述:该数据集包含来自越南语文本的情感标注数据,主要用于情感分析任务。主要特征如下:... -
摩洛哥达里贾语情感分析数据集-tariklemkadem
摩洛哥达里贾语情感分析数据集-tariklemkadem 数据来源:互联网公开数据 标签:情感分析,达里贾语,自然语言处理,文本挖掘,数据集,机器学习,摩洛哥文化,语言学 数据概述: 该数据集包含了摩洛哥达里贾语文本数据,用于情感分析任务。主要特征如下: 时间跨度: 数据集未明确标注具体的时间跨度,但数据采集的时间与摩洛哥社交媒体的活跃时间相关。... -
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源:互联网公开数据 标签:讽刺,嘲讽,情感分析,自然语言处理,文本数据,机器学习,情感识别,语言学 数据概述: 该数据集包含了标注了讽刺和嘲讽情感的文本数据,旨在用于情感分析和自然语言处理任务。主要特征如下:... -
数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050
2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:... -
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk 数据来源:互联网公开数据 标签:乌尔都语,字母,数据集,图像识别,机器学习,文本分析,语言学,文化研究 数据概述: 该数据集包含乌尔都语字母的图像数据,旨在用于字母识别和相关语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了乌尔都语字母的静态图像。... -
海湾地区方言数据集GulfDialectsDataset-afifaalawami
海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:... -
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa 数据来源:互联网公开数据 标签:方言研究,土耳其语言,数据集,自然语言处理,语言学,文化研究,语音识别,社会科学 数据概述:该数据集包含来自土耳其不同地区的方言数据,记录了土耳其各地域的方言特点和语音特征。主要特征如下:... -
印地语仇恨言论分析数据集-yash3056
印地语仇恨言论分析数据集-yash3056 数据来源:互联网公开数据 标签:仇恨言论,印地语,自然语言处理,文本分析,情感分析,社交媒体,数据集,语言学 数据概述: 该数据集包含来自社交媒体平台的印地语文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度: 数据记录的时间范围,通常涵盖社交媒体平台上印地语文本发布的时间段。 地理范围:... -
乌尔都语威胁言论检测数据集-oyehoney19
乌尔都语威胁言论检测数据集-oyehoney19 数据来源:互联网公开数据 标签:自然语言处理,威胁言论检测,乌尔都语,文本分析,机器学习,情感分析,社交媒体,语言学 数据概述: 该数据集包含乌尔都语文本数据,旨在用于威胁言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源的发布时间。... -
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:... -
韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06
韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06 数据来源:互联网公开数据 标签:翻译数据集,自然语言处理,机器学习,数据集,语言学,文本翻译,韩语,越南语 数据概述:该数据集包含来自互联网公开资源的112,000条韩语到越南语的翻译对,适用于自然语言处理和机器翻译任务。主要特征如下:... -
方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni
方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni 数据来源:互联网公开数据 标签:方言语音,语音识别,数据集,自然语言处理,机器学习,人工智能,语音技术,语言学 数据概述:该数据集包含来自不同地区和方言的语音录音,记录了各类方言的语音特征和发音方式。主要特征如下:... -
数据1985年阿尔巴尼亚百科全书数据集-ashahini
1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:... -
形态学分析数据集-faizankhan6356
形态学分析数据集-faizankhan6356 数据来源:互联网公开数据 标签:形态学,语言学,自然语言处理,数据集,词性标注,词干提取,词形还原,文本分析 数据概述: 该数据集包含了用于形态学分析的文本数据,记录了不同语言的词汇及其形态变化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集,可能涵盖多个历史时期和现代语言。... -
俚语数据集SlangDataDataset-jhyunkim
俚语数据集SlangDataDataset-jhyunkim 数据来源:互联网公开数据 标签:俚语,语言学,数据集,文本分析,自然语言处理,社交媒体,文化研究,词汇学 数据概述: 该数据集包含了大量来自互联网的俚语数据,旨在用于语言学研究,文本分析和自然语言处理等领域。主要特征如下:... -
孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi
孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi 数据来源:互联网公开数据 标签:电子行业,词汇规范化,数据集,自然语言处理,机器学习,数据挖掘,语言学,文本分析 数据概述: 该数据集包含来自孟加拉电子行业的词汇规范化数据,记录了电子产品相关的词汇及其标准化形式。主要特征如下:... -
汉字笔画顺序数据集-dreamitpossible
汉字笔画顺序数据集-dreamitpossible 数据来源:互联网公开数据 标签:汉字,笔画顺序,数据集,书写,中文,教育,语言学,汉字结构 数据概述: 该数据集包含汉字的笔画顺序数据,记录了汉字书写时笔画的正确顺序。主要特征如下: 时间跨度:数据记录的时间范围为现代。 地理范围:数据主要涵盖中国大陆地区使用的汉字。... -
罗马乌尔都语文本情感分析数据集-adilahmedcs
罗马乌尔都语文本情感分析数据集-adilahmedcs 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,情感分析,自然语言处理,文本数据,机器学习,语言学,社交媒体 数据概述: 该数据集包含来自互联网的罗马乌尔都语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了从社交媒体,论坛等平台收集的近期数据。... -
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...