找到673个数据集

标签: 语言学

过滤结果
  • 孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi

    2025年4月26日   

    孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi 数据来源:互联网公开数据 标签:孟加拉语,词形还原,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自孟加拉语书籍的词形还原数据,记录了孟加拉语文本中单词的词形还原结果。主要特征如下:...
    packageimg
  • 英语高频词汇统计数据集-sudosharma

    2025年4月26日   

    英语高频词汇统计数据集-sudosharma 数据来源:互联网公开数据 标签:英语,词汇,数据集,语言学,频率分析,自然语言处理,文本分析,词频统计 数据概述:该数据集包含了英语中出现频率最高的一批词汇,记录了这些词汇及其对应的出现频率。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于语料库的更新。 地理范围:数据覆盖范围为英语通用语料库。...
    packageimg
  • 拉丁与西里尔字母数据集LatinandCyrillicLettersDataset-oleksiichornyi

    2025年4月26日   

    拉丁与西里尔字母数据集LatinandCyrillicLettersDataset-oleksiichornyi 数据来源:互联网公开数据 标签:拉丁字母, 西里尔字母, 数据集, 字母识别, 机器学习, 文字处理, 文化研究, 语言学 数据概述: 该数据集包含拉丁字母和西里尔字母的数据,记录了两种字母系统中的字母及其相关特征。主要特征如下:...
    packageimg
  • 印地语语流中断数据集HindiDisfluencyDataset-daspinaki

    2025年4月26日   

    印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:...
    packageimg
  • 美国婴儿姓名统计数据集NationalNamesDataset-solarfury

    2025年4月26日   

    美国婴儿姓名统计数据集NationalNamesDataset-solarfury 数据来源:互联网公开数据 标签:姓名,统计,人口,数据集,性别,文化研究,社会科学,语言学 数据概述: 该数据集包含来自美国社会保障局的婴儿姓名数据,记录了自1880年以来美国新生儿的姓名,性别及年度统计数量。主要特征如下:...
    packageimg
  • 姓氏数据库BaseofSurnames-vakhrameevsergey

    2025年4月26日   

    姓氏数据库BaseofSurnames-vakhrameevsergey 数据来源:互联网公开数据 标签:姓氏,人口统计,数据集,社会学,语言学,文化研究,数据分析,姓名学 数据概述: 该数据集包含姓氏相关信息,记录了不同国家和地区的姓氏数据。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各数据源的更新频率。...
    packageimg
  • 电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86

    2025年4月26日   

    电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...
    packageimg
  • 肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle

    2025年4月26日   

    肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle 数据来源:互联网公开数据 标签:手语,数据集,肯尼亚,语言学,图像识别,机器学习,聋人社区,文化研究 数据概述: 该数据集包含肯尼亚手语的视频数据,记录了不同手语词汇和短语的视觉表现。主要特征如下:...
    packageimg
  • 摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg

    2025年4月25日   

    摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,阿拉伯语,文本分类,情感分析,机器学习,语言学 数据概述: 该数据集包含摩洛哥阿拉伯语(Darija)文本,用于仇恨言论检测任务。主要特征如下: 时间跨度:...
    packageimg
  • 古兰经数据集QuranDataDataset-raghadraghad

    2025年4月25日   

    古兰经数据集QuranDataDataset-raghadraghad 数据来源:互联网公开数据 标签:古兰经,宗教,数据集,文本分析,语言学,文学,语义分析,伊斯兰研究 数据概述: 该数据集包含了古兰经的文本数据,适用于宗教研究,文本分析和语言学研究等任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了古兰经的成书时期及后续版本。...
    packageimg
  • 英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa

    2025年4月25日   

    英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:...
    packageimg
  • 波斯语数据集PersianDataset-amirali10281

    2025年4月25日   

    波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。...
    packageimg
  • 孟加拉语文本情感分析数据集-shadikaafroze

    2025年4月25日   

    孟加拉语文本情感分析数据集-shadikaafroze 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本数据,孟加拉语,机器学习,情感分类,数据集,语言学 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据收集时间跨度未知,但包含了近期和历史的孟加拉语文本。...
    packageimg
  • 突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel

    2025年4月25日   

    突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,突尼斯语,语言学,机器学习,人工智能,文本挖掘 数据概述:该数据集包含来自突尼斯的自然语言处理数据,记录了突尼斯语文本的多方面信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • 印度人名数据集IndianNamesDataset-chaitanyapatil7

    2025年4月25日   

    印度人名数据集IndianNamesDataset-chaitanyapatil7 数据来源:互联网公开数据 标签:人名,印度,数据集,语言学,文化研究,数据挖掘,机器学习,身份识别 数据概述: 该数据集包含来自印度的常见人名数据,记录了印度不同地区,民族和宗教背景下的姓名信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。...
    packageimg
  • 阿拉伯语文本情感分析数据集-akshat18

    2025年4月25日   

    阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:...
    packageimg
  • 英语词汇与定义数据集VAL-EN-DFDataset-bamps53

    2025年4月25日   

    英语词汇与定义数据集VAL-EN-DFDataset-bamps53 数据来源:互联网公开数据 标签:英语词汇,定义,数据集,自然语言处理,词义消歧,语言学,文本分析,机器学习 数据概述: 该数据集包含了大量的英语词汇及其对应的定义,主要用于自然语言处理和语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir

    2025年4月25日   

    乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir 数据来源:互联网公开数据 标签:情感分析,自然语言处理,乌尔都语,文本数据,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含乌尔都语文本数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 印地语-英语混合语言数据集-saahir2629

    2025年4月25日   

    印地语-英语混合语言数据集-saahir2629 数据来源:互联网公开数据 标签:印地语,英语,混合语言,数据集,自然语言处理,文本分析,机器翻译,语言学 数据概述:该数据集包含印地语和英语混合语言的文本数据,记录了两种语言混合使用的各种场景。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了现代社交媒体和日常交流中的常见用例。...
    packageimg
  • 英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35

    2025年4月25日   

    英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:...
    packageimg