找到672个数据集

标签: 语言学

过滤结果
  • 梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集

    2025年4月15日   

    梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N....
    packageimg
  • 自然故事语料库数据集1963-2021

    2025年4月15日   

    自然故事语料库数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,阅读时间,语料库,低频语法构型,心理学,语言学 数据概述:...
    packageimg
  • 当代美国英语语料库数据集

    2025年4月15日   

    当代美国英语语料库数据集 数据来源:互联网公开数据 标签:美国英语,语料库,语言学,文本分析,文学,新闻,学术,社交媒体,电影字幕,电视字幕 数据概述:...
    packageimg
  • 单词难度预测数据集

    2025年4月15日   

    单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv...
    packageimg
  • 莎士比亚十四行诗菲律宾语翻译数据集

    2025年4月15日   

    莎士比亚十四行诗菲律宾语翻译数据集 数据来源:互联网公开数据 标签:莎士比亚,十四行诗,翻译,菲律宾语,Tagalog,文本数据,文学,语言学 数据概述: 本数据集包含威廉·莎士比亚十四行诗的ASCII文本,总共有超过2,450行。原文本从Andrej Karpathy的GitHub仓库minGPT复制而来。随后,我们使用ChatGPT...
    packageimg
  • 印度尼西亚至马来语桑巴斯翻译数据集

    2025年4月15日   

    印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:...
    packageimg
  • 比萨亚成语与英语对照数据集

    2025年4月15日   

    比萨亚成语与英语对照数据集 数据来源:互联网公开数据 标签:比萨亚语,成语,英语,语言学,对照表,文化研究 数据概述:...
    packageimg
  • 孟加拉语动词拆解数据集1963-2021

    2025年4月15日   

    孟加拉语动词拆解数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,动词拆解,词性标注,语言学,自然语言处理 数据概述: 本数据集收录了孟加拉语中的所有根动词,并将其映射到相应的词性标注。数据集为孟加拉语的语言学研究提供了基础性的词汇和语法资源。 数据用途概述:...
    packageimg
  • 西班牙推特暗示抑郁数据集

    2025年4月15日   

    西班牙推特暗示抑郁数据集 数据来源:互联网公开数据 标签:抑郁,推特,社交媒体,心理健康,情感分析,语言学,行为分析 数据概述: 本数据集包含1000条由90名不同用户发布的西班牙语推特,这些推特暗示了抑郁的迹象。数据集中的推特经过人工筛选和整理,旨在用于检测和分析西班牙语推特中抑郁症状的迹象。 数据用途概述:...
    packageimg
  • 旁遮普语沙木基语料库词频统计数据集

    2025年4月15日   

    旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。...
    packageimg
  • 英语短语和谚语数据集

    2025年4月15日   

    英语短语和谚语数据集 数据来源:互联网公开数据 标签:英语短语,谚语,语言学,文化研究,教育,翻译 数据概述: 本数据集包含数千条英语短语和谚语,涵盖了日常表达、文化背景和智慧格言等多个方面。数据集适合用于语言学研究、文化分析、教育和翻译等多种场景。 数据用途概述:...
    packageimg
  • 俄罗斯版Esquire杂志-我学到的-访谈语录数据集

    2025年4月15日   

    俄罗斯版Esquire杂志-我学到的-访谈语录数据集 数据来源:互联网公开数据 标签:Esquire,访谈,语录,俄罗斯,名人,文化,语言学,文本分析 数据概述: 本数据集收录了俄罗斯版Esquire杂志“我学到的”系列访谈内容。该系列访谈汇集了各行各业名人的生活感悟和人生经验。数据集包含访谈原文,为俄语。 数据用途概述:...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日   

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • WordNet反义词数据集-2006

    2025年4月15日   

    WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"...
    packageimg
  • 摩洛哥方言-英语词汇对照数据集

    2025年4月15日   

    摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:...
    packageimg
  • 英语词汇综合列表数据集

    2025年4月15日   

    英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:...
    packageimg
  • 印度僧伽罗语歌曲与比喻数据集

    2025年4月15日   

    印度僧伽罗语歌曲与比喻数据集 数据来源:互联网公开数据 标签:僧伽罗语,歌曲,比喻,歌词分析,文化研究,语言学,文学 数据概述: 本数据集包含与僧伽罗语歌曲及其所用比喻相关的信息。数据涵盖了各类僧伽罗语歌曲的歌词、歌曲主题、使用的比喻及其含义等关键要素,为研究僧伽罗语文化和文学提供了丰富的语言材料。 数据用途概述:...
    packageimg
  • 波斯语文本蕴含推理数据集FarsTail

    2025年4月15日   

    波斯语文本蕴含推理数据集FarsTail 数据来源:互联网公开数据 标签:自然语言处理,文本蕴含,NLI,波斯语,波斯文,Farsi,数据集,机器翻译,语言学 数据概述:...
    packageimg
  • 英语到阿萨姆语平行语料库数据集

    2025年4月15日   

    英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt...
    packageimg
  • 讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集

    2025年4月15日   

    讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:...
    packageimg