-
阿拉伯诗歌语境数据集-多国家多时代阿拉伯诗歌-ahmedabelal
阿拉伯诗歌语境数据集-多国家多时代阿拉伯诗歌-ahmedabelal 数据来源:互联网公开数据 标签:阿拉伯诗歌,诗歌生成,机器学习,Pytorch,文学,数据集,文化,语言学 数据概述:... -
吠陀文献梵文与纳格里文字对照及其英译数据集-anshulmehtakaggl
吠陀文献梵文与纳格里文字对照及其英译数据集-anshulmehtakaggl 数据来源:互联网公开数据 标签:梵文,吠陀文献,纳格里文,英译,翻译,NLP,语言学 数据概述: 本数据集收录了吠陀文献中的梵文字词及其对应的纳格里文字母写法和英文翻译。数据集旨在为语言学研究、翻译工作、自然语言处理(NLP)等领域提供基础数据支持。数据集字段包括:... -
土耳其诗歌情感分析及NLP应用数据集-emreokcular
土耳其诗歌情感分析及NLP应用数据集-emreokcular 数据来源:互联网公开数据 标签:土耳其诗歌,NLP,情感分析,诗歌创作,文本分析,文化研究,语言学,文学 数据概述:... -
新墨西哥大学西班牙语二语者瞳孔数据-2019年9月-10月-priscilalpezbeltrn
新墨西哥大学西班牙语二语者瞳孔数据-2019年9月-10月-priscilalpezbeltrn 数据来源:互联网公开数据 标签:瞳孔数据,西班牙语,二语者,语言学,心理语言学,新墨西哥大学,语言习得,语言加工,社会语言学,词汇,句法 数据概述:... -
英法翻译数据集-英语至法语翻译项目-数据-通用
英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-... -
泰米尔文字字符图像与文化研究数据集
泰米尔文字字符图像与文化研究数据集 数据来源:互联网公开数据 标签:泰米尔语,文字,字符,图像,文化,语言学,字体,视觉,教育 数据概述:... -
纽约时报填字游戏线索与答案数据集
纽约时报填字游戏线索与答案数据集 数据来源:互联网公开数据 标签:填字游戏,纽约时报,英语词汇,文化分析,语言学,历史数据,娱乐教育 数据概述:... -
Kokoro日语语音数据集-Tiny版
Kokoro日语语音数据集-Tiny版 数据来源:互联网公开数据 标签:日语,语音,音频,语音合成,LibriVox,MeCab,UniDic Lite,公共领域,有声书,语言学 数据概述:... -
全球352种语言形态标注数据集
全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:... -
Reddit百万笑话语料库数据集-2020年4月1日前
Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:... -
单词流行度数据集用于单词拼图创作研究
单词流行度数据集用于单词拼图创作研究 数据来源:互联网公开数据 标签:单词流行度,单词拼图,词频分析,英语,语言学,教育研究,词汇习得 数据概述:... -
-
荷马伊利亚特文本数据集
荷马伊利亚特文本数据集 数据来源:互联网公开数据 标签:荷马,伊利亚特,双语文本,希腊语,英语,翻译,文学分析,语言学,比较文学 数据概述: 本数据集包含荷马史诗《伊利亚特》的双语文本,分别为希腊语原文和英文翻译。数据集由三个表格组成,每个表格包含分析《伊利亚特》所需的必要信息。 希腊文本表:... -
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。... -
尼泊尔语文本情感分析数据集
尼泊尔语文本情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,文本分类,自然语言处理,语言学,情感标签 数据概述: 本数据集包含了尼泊尔语的句子,并附带了情感标签。数据集旨在用于尼泊尔语文本的情感分析任务。每个句子都对应一个情感标签,用于区分句子的情感倾向。 情感标签定义如下: 1:正面情感 0:负面情感 2:中性情感 数据用途概述:... -
哈萨克族姓名数据集
哈萨克族姓名数据集 数据来源:互联网公开数据 标签:哈萨克族,姓名,文化研究,语言学,人口统计,民族学 数据概述: 本数据集收录了哈萨克族中常见的男性和女性姓名,为研究哈萨克族文化、语言和人口结构提供了宝贵的数据资源。数据包含数千个哈萨克族姓名的记录,适用于各种文化和社会科学研究。 数据用途概述:... -
多语言平行语料库释义数据集-73种语言
多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves... -
宾夕法尼亚大学语料库初步版本数据集
宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:... -
数据2021年全球常用表情符号使用频率排名数据集
数据2021年全球常用表情符号使用频率排名数据集 数据来源:互联网公开数据 标签:表情符号,emoji,社交媒体,Unicode,频率分析,数据可视化,语言学,文化交流 数据概述: 本数据集包含了2021年全球范围内最常用的表情符号(emoji)的使用频率排名信息,数据来源于Unicode联盟的Emoji... -
波萨诺瓦歌词数据集
波萨诺瓦歌词数据集 数据来源:互联网公开数据 标签:波萨诺瓦,巴西音乐,歌词,音乐分析,文化研究,语言学 数据概述: 本数据集包含超过5000首波萨诺瓦歌曲的歌词及相关信息,涵盖了波萨诺瓦音乐风格的发展历程。数据集中的每首歌曲都记录了歌曲名称、演唱者、歌词内容、作曲者、歌曲语言等关键信息,为研究波萨诺瓦音乐的文化背景和语言特征提供了丰富的资源。...