找到1,291个数据集

标签: 语料库

过滤结果
  • 斯瓦希里语句子标注数据集-2023-hassen7

    2025年4月22日   

    斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:...
    packageimg
  • Reddit语境与主题分类语料库-linkanjarad

    2025年4月21日   

    Reddit语境与主题分类语料库-linkanjarad 数据来源:互联网公开数据 标签:语境分类,主题分类,语料库,Reddit,文本分析,自然语言处理,情感分析 数据概述:...
    packageimg
  • 电影对话语料库第一部分-1963至2021年-ilabyu

    2025年4月21日   

    电影对话语料库第一部分-1963至2021年-ilabyu 数据来源:互联网公开数据 标签:电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习 数据概述:...
    packageimg
  • 日本常用词形频率数据集-2021-rtatman

    2025年4月21日   

    日本常用词形频率数据集-2021-rtatman 数据来源:互联网公开数据 标签:日语,词形,频率,语料库,词频分析,日语文本,日本语言学,词性分布,跨语言比较 数据概述:...
    packageimg
  • 斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac

    2025年4月21日   

    斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac 数据来源:互联网公开数据 标签:抄袭检测,僧伽罗语,学术研究,数据集,文本分析,语料库 数据概述:...
    packageimg
  • 句子间连接数据集

    2025年4月21日   

    句子间连接数据集 数据来源:互联网公开数据 标签:跨语言连接,多语言资源,语言对齐,语料库,NLP研究 数据概述: 本数据集记录了不同语言之间的句子配对,主要来源于Tatoeba项目。数据集包含了多种语言的句子及其对应关系,为研究和开发多语言自然语言处理任务提供了宝贵的资源。 数据用途概述:...
    packageimg
  • 殖民地历史葡萄牙语语料库1500-1936

    2025年4月20日   

    殖民地历史葡萄牙语语料库1500-1936 数据来源:互联网公开数据 标签:历史葡萄牙语,语料库,词性标注,文学研究,语言演变,欧洲葡萄牙语,巴西葡萄牙语,时间序列 数据概述:...
    packageimg
  • 阿拉伯诗歌历史与分类数据集6世纪-现代

    2025年4月20日   

    阿拉伯诗歌历史与分类数据集6世纪-现代 数据来源:互联网公开数据 标签:阿拉伯诗歌,文学,历史,社会,政治,文化,分类,语料库 数据概述:...
    packageimg
  • 阿尔及利亚网阿拉伯语新闻文章数据集1963-2021

    2025年4月19日   

    阿尔及利亚网阿拉伯语新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯语新闻,自然语言处理,机器学习,语料库,情感分析,主题分类,命名实体识别 数据概述:...
    packageimg
  • 德国300万句子数据集

    2025年4月19日   

    德国300万句子数据集 数据来源:互联网公开数据 标签:德语,句子,语料库,语言学研究,自然语言处理,文本分析,频率统计 数据概述:...
    packageimg
  • Tarjoman波斯语文本数据集

    2025年4月18日   

    Tarjoman波斯语文本数据集 数据来源:互联网公开数据 标签:波斯语,文本爬取,新闻文章,语料库,文本分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 孟加拉语维基百科数据集

    2025年4月17日   

    孟加拉语维基百科数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,文本挖掘,机器学习,语料库 数据概述:...
    packageimg
  • 泰卢固语新闻文本数据集-语言模型训练-合并数据集

    2025年4月17日   

    泰卢固语新闻文本数据集-语言模型训练-合并数据集 数据来源:互联网公开数据 标签:泰卢固语,新闻,文本,语言模型,自然语言处理,NLP,机器学习,语料库,文本数据 数据概述: 本数据集由原始泰卢固语新闻数据合并的训练集和测试集构成,整合了来自不同来源的泰卢固语新闻文章。数据集包含丰富的新闻文本内容,涵盖了各种主题和风格。 数据用途概述:...
    packageimg
  • 英语-伊博语圣经数据集

    2025年4月17日   

    英语-伊博语圣经数据集 数据来源:互联网公开数据 标签:机器翻译,伊博语,圣经文本,英语,语言数据,语料库,宗教文本 数据概述: 本数据集为英语和伊博语的圣经文本对齐数据,主要用于英语至伊博语的机器翻译研究。数据来源于Jehovah...
    packageimg
  • 古典藏文-英文翻译数据集

    2025年4月17日   

    古典藏文-英文翻译数据集 数据来源:互联网公开数据 标签:古典藏文,英文翻译,机器翻译,语料库,语言学研究,MT模型训练 数据概述: 本数据集包含古典藏文句子及其对应的英文翻译,每对数据由古典藏文句子和其英文翻译组成。数据集中的文本来源于Lotsawa...
    packageimg
  • 政治思想作品语料库数据集1963-2021

    2025年4月16日   

    政治思想作品语料库数据集1963-2021 数据来源:互联网公开数据 标签:政治思想,语料库,历史,现代,文本分析,自然语言处理,词频分析,推荐系统 数据概述:...
    packageimg
  • IWSLT2017英语-中文翻译数据集

    2025年4月15日   

    IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...
    packageimg
  • 西班牙语书籍语料库

    2025年4月15日   

    西班牙语书籍语料库 数据来源:互联网公开数据 标签:西班牙语,语料库,文本分析,词性标注,儿童文学,成人文学,词频统计,文本边界分析 数据概述:...
    packageimg
  • 宾夕法尼亚大学语料库初步版本数据集

    2025年4月15日   

    宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:...
    packageimg
  • 德古拉与傲慢与偏见文本分类数据集

    2025年4月15日   

    德古拉与傲慢与偏见文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,文学作品,情感分析,语料库,句子级别 数据概述: 本数据集包含《德古拉》(Dracula)和《傲慢与偏见》(Pride and...
    packageimg