-
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源:互联网公开数据 标签:讽刺,嘲讽,情感分析,自然语言处理,文本数据,机器学习,情感识别,语言学 数据概述: 该数据集包含了标注了讽刺和嘲讽情感的文本数据,旨在用于情感分析和自然语言处理任务。主要特征如下:... -
数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050
2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:... -
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk 数据来源:互联网公开数据 标签:乌尔都语,字母,数据集,图像识别,机器学习,文本分析,语言学,文化研究 数据概述: 该数据集包含乌尔都语字母的图像数据,旨在用于字母识别和相关语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了乌尔都语字母的静态图像。... -
海湾地区方言数据集GulfDialectsDataset-afifaalawami
海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:... -
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa 数据来源:互联网公开数据 标签:方言研究,土耳其语言,数据集,自然语言处理,语言学,文化研究,语音识别,社会科学 数据概述:该数据集包含来自土耳其不同地区的方言数据,记录了土耳其各地域的方言特点和语音特征。主要特征如下:... -
印地语仇恨言论分析数据集-yash3056
印地语仇恨言论分析数据集-yash3056 数据来源:互联网公开数据 标签:仇恨言论,印地语,自然语言处理,文本分析,情感分析,社交媒体,数据集,语言学 数据概述: 该数据集包含来自社交媒体平台的印地语文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度: 数据记录的时间范围,通常涵盖社交媒体平台上印地语文本发布的时间段。 地理范围:... -
乌尔都语威胁言论检测数据集-oyehoney19
乌尔都语威胁言论检测数据集-oyehoney19 数据来源:互联网公开数据 标签:自然语言处理,威胁言论检测,乌尔都语,文本分析,机器学习,情感分析,社交媒体,语言学 数据概述: 该数据集包含乌尔都语文本数据,旨在用于威胁言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源的发布时间。... -
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:... -
韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06
韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06 数据来源:互联网公开数据 标签:翻译数据集,自然语言处理,机器学习,数据集,语言学,文本翻译,韩语,越南语 数据概述:该数据集包含来自互联网公开资源的112,000条韩语到越南语的翻译对,适用于自然语言处理和机器翻译任务。主要特征如下:... -
方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni
方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni 数据来源:互联网公开数据 标签:方言语音,语音识别,数据集,自然语言处理,机器学习,人工智能,语音技术,语言学 数据概述:该数据集包含来自不同地区和方言的语音录音,记录了各类方言的语音特征和发音方式。主要特征如下:... -
数据1985年阿尔巴尼亚百科全书数据集-ashahini
1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:... -
形态学分析数据集-faizankhan6356
形态学分析数据集-faizankhan6356 数据来源:互联网公开数据 标签:形态学,语言学,自然语言处理,数据集,词性标注,词干提取,词形还原,文本分析 数据概述: 该数据集包含了用于形态学分析的文本数据,记录了不同语言的词汇及其形态变化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集,可能涵盖多个历史时期和现代语言。... -
俚语数据集SlangDataDataset-jhyunkim
俚语数据集SlangDataDataset-jhyunkim 数据来源:互联网公开数据 标签:俚语,语言学,数据集,文本分析,自然语言处理,社交媒体,文化研究,词汇学 数据概述: 该数据集包含了大量来自互联网的俚语数据,旨在用于语言学研究,文本分析和自然语言处理等领域。主要特征如下:... -
孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi
孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi 数据来源:互联网公开数据 标签:电子行业,词汇规范化,数据集,自然语言处理,机器学习,数据挖掘,语言学,文本分析 数据概述: 该数据集包含来自孟加拉电子行业的词汇规范化数据,记录了电子产品相关的词汇及其标准化形式。主要特征如下:... -
汉字笔画顺序数据集-dreamitpossible
汉字笔画顺序数据集-dreamitpossible 数据来源:互联网公开数据 标签:汉字,笔画顺序,数据集,书写,中文,教育,语言学,汉字结构 数据概述: 该数据集包含汉字的笔画顺序数据,记录了汉字书写时笔画的正确顺序。主要特征如下: 时间跨度:数据记录的时间范围为现代。 地理范围:数据主要涵盖中国大陆地区使用的汉字。... -
罗马乌尔都语文本情感分析数据集-adilahmedcs
罗马乌尔都语文本情感分析数据集-adilahmedcs 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,情感分析,自然语言处理,文本数据,机器学习,语言学,社交媒体 数据概述: 该数据集包含来自互联网的罗马乌尔都语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了从社交媒体,论坛等平台收集的近期数据。... -
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:... -
英语到乌尔都语句子翻译数据集-syednabeeluddin
英语到乌尔都语句子翻译数据集-syednabeeluddin 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,英语,乌尔都语,翻译,语言学,深度学习 数据概述: 该数据集包含英语句子及其对应的乌尔都语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了现代英语和乌尔都语的常用表达。... -
英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra
英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,平行语料,印地语,英语,数据集,语言学,人工智能 数据概述: 该数据集包含英语和印地语的平行文本数据,记录了两种语言之间的对应翻译内容。主要特征如下:... -
法国姓名数据集FrenchNamesDataset-syphax93
法国姓名数据集FrenchNamesDataset-syphax93 数据来源:互联网公开数据 标签:姓名,数据集,人口统计,文化研究,语言学,社会学,历史,法国 数据概述: 该数据集包含来自法国的人名数据,记录了法国不同地区,不同时间阶段的常用姓名。主要特征如下: 时间跨度:数据记录的时间范围从19世纪到现代。...