找到672个数据集

标签: 语言学

过滤结果
  • 机器翻译文本对数据集

    2025年7月21日 30 21 7

    机器翻译文本对数据集_Machine_Translation_Text_Pairs 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言学, 文本翻译, 英语, 葡萄牙语, 自然语言处理, 双语语料库 数据概述: 该数据集包含来自互联网的翻译文本对,记录了英语与葡萄牙语之间的句子翻译实例,适用于机器翻译模型的训练与评估。主要特征如下:...
    packageimg
  • 英语写作质量评估多维度数据集

    2025年7月14日 60 11 2

    英语写作质量评估多维度数据集_English_Writing_Quality_Multi_dimensional_Dataset 数据来源:互联网公开数据 标签:英语写作, 质量评估, 文本分析, 多维度评价, 自然语言处理, 机器学习, 写作技能, 语言学 数据概述:...
    packageimg
  • 语言流畅度评估多维度数据集

    2025年7月19日 30 14 1

    语言流畅度评估多维度数据集_Language_Fluency_Evaluation_Multi_dimensional_Dataset 数据来源:互联网公开数据 标签:文本评估, 语言学, 写作质量, 自然语言处理, 机器学习, 语言模型, 文本分析, 语义理解 数据概述:...
    packageimg
  • 多语言语音数据集

    2025年7月11日 30 22 6

    多语言语音数据集_Multilingual_Speech_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音合成, 多语言, 文本转语音, 声纹识别, 语音数据, 机器学习, 语言学 数据概述: 该数据集包含多语言语音数据,记录了不同说话者的语音片段及其对应的文本内容。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态语音语料。...
    packageimg
  • 爱尔兰语_英语平行语料库数据集

    2025年7月10日 30 29 8

    爱尔兰语_英语平行语料库数据集_Irish_English_Parallel_Corpus 数据来源:互联网公开数据 标签:机器翻译, 语言学, 平行语料库, 爱尔兰语, 英语, 自然语言处理, 文本翻译, 数据集构建 数据概述: 该数据集包含来自多个来源的爱尔兰语-英语平行语料,旨在促进爱尔兰语和英语之间的机器翻译研究与应用。主要特征如下:...
    packageimg
  • 语音口音档案数据集

    2025年6月4日 30 11 7

    语音口音档案数据集 数据来源:互联网公开数据 标签:语音分析,口音研究,语言学,语音识别,英语学习,社会语言学,多元文化 数据概述:...
    packageimg
  • 语言词源关系数据集-bilalelebi

    2025年6月1日 30 17 3

    语言词源关系数据集-bilalelebi 数据来源:互联网公开数据 标签:词源学,语言学,词汇,关系,跨语言,历史,文化,语义 数据概述:...
    packageimg
  • 诗歌与更多诗意数据集-2023-watrgoat

    2025年6月1日 30 17 1

    诗歌与更多诗意数据集-2023-watrgoat 数据来源:互联网公开数据 标签:诗歌,文学,自然语言生成,NLG,文本生成,语言学,英语诗歌 数据概述:...
    packageimg
  • 乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22

    2025年6月1日 30 11 1

    乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22 数据来源:互联网公开数据 标签:乌尔都语,OCR,文本识别,印刷文本,深度学习,机器学习,图像,文本,语言学,计算机视觉 数据概述: 本数据集是MMU-OCR-21数据集的扩展,旨在为印刷乌尔都语光学字符识别(OCR)任务提供一个公开可用的数据集。MMU-...
    packageimg
  • 全球姓名性别与国家分布数据集-erpel1

    2025年5月31日 30 28 5

    全球姓名性别与国家分布数据集-erpel1 数据来源:互联网公开数据 标签:姓名,性别,国家,人口统计,命名,文化研究,语言学,社会学 数据概述: 本数据集包含来自105个不同国家的500万个名字(First Name)和800万个姓氏(Last Name)。 每个名字或姓氏都标注了性别、国家以及在原始数据中的出现次数。...
    packageimg
  • 推特-趣味事实-推文内容分析数据集英文

    2025年5月31日 30 27 9

    推特-趣味事实-推文内容分析数据集英文 数据来源:互联网公开数据 标签:推特,社交媒体,趣味事实,推文,内容分析,语言学,信息传播,英语 数据概述: 本数据集收录了推特(Twitter)上所有包含短语“Fun...
    packageimg
  • 尼泊尔普拉吉特文字手写文本数据集-svarnimn

    2025年5月31日 30 10 8

    尼泊尔普拉吉特文字手写文本数据集-svarnimn 数据来源:互联网公开数据 标签:尼泊尔语,普拉吉特文字,手写文本,语言学,文化遗产,文本分析,历史文献,文字识别 数据概述:...
    packageimg
  • 语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima

    2025年5月31日 30 17 4

    语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源:互联网公开数据 标签:语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集 数据概述:...
    packageimg
  • 语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-ivanblch

    2025年5月31日 30 26 6

    语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-ivanblch 数据来源:互联网公开数据 标签:语言校对, 语法检查, 词汇纠错, 自然语言处理, 文本分析, 语言学, 规则库, 机器学习 数据概述:...
    packageimg
  • 俄罗斯Telegram频道文章文本与主题分类数据集

    2025年5月31日 30 13 8

    俄罗斯Telegram频道文章文本与主题分类数据集 数据来源:互联网公开数据 标签:Telegram,社交媒体,俄罗斯,文本分析,主题分类,语言学,舆情分析,新闻,政治 数据概述: 本数据集包含了俄罗斯语Telegram频道帖子的标注文本。数据的主要组成部分是帖子的文本内容以及对应的主题分类标签。 数据用途概述:...
    packageimg
  • 老挝语-越南语机器翻译语料库越南语文本数据集-zuydang

    2025年5月31日 30 28 4

    老挝语-越南语机器翻译语料库越南语文本数据集-zuydang 数据来源:互联网公开数据 标签:机器翻译,语料库,老挝语,越南语,文本,语言学,自然语言处理,ALT 数据概述: 本数据集是从ALT(亚洲语言技术)项目中提取的老挝语-...
    packageimg
  • 法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024

    2025年5月31日 30 15 7

    法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024 数据来源:互联网公开数据 标签:法国说唱,歌词,文本分析,音乐,语言学,文化研究,RapGenius,嘻哈 数据概述:...
    packageimg
  • 孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder

    2025年5月30日 30 10 3

    孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder 数据来源:互联网公开数据 标签:文本分割, 孟加拉语, 自然语言处理, 语料库, 文本分析, 机器翻译, 数据标注, 语言学 数据概述: 该数据集包含孟加拉语文本,记录了用于训练和评估文本分割模型的数据。主要特征如下:...
    packageimg
  • 英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock

    2025年5月29日 60 22 8

    英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 写作评估, 语言模型, 文本质量, 机器学习, 文本评分, 语言学 数据概述: 该数据集包含用于评估英语写作质量的相关数据,涵盖了文本评估的多个维度。主要特征如下:...
    packageimg
  • 柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato

    2025年5月30日 30 12 3

    柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:...
    packageimg