找到50个数据集

标签: 语言资源

过滤结果
  • 基尼瓦尔语对话数据集KinyarwandaConversationDatasets-iranzidev

    2025年4月25日   

    基尼瓦尔语对话数据集KinyarwandaConversationDatasets-iranzidev 数据来源:互联网公开数据 标签:基尼瓦尔语,对话数据,自然语言处理,语音识别,多语言,机器学习,语言资源,非洲语言 数据概述: 该数据集包含来自基尼瓦尔语(卢旺达官方语言之一)的对话数据,记录了基尼瓦尔语的口语交流内容。主要特征如下:...
    packageimg
  • 楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov

    2025年4月25日   

    楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
    packageimg
  • 阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals

    2025年4月25日   

    阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals 数据来源:互联网公开数据 标签:阿拉伯语,新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻分类,语言资源 数据概述: 该数据集包含来自沙特阿拉伯Sabq新闻网站的文章数据,记录了网站发布的阿拉伯语新闻报道。主要特征如下:...
    packageimg
  • 阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki

    2025年4月25日   

    阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:...
    packageimg
  • 尼泊尔语词典数据集NepaliDictionaryDataset-rakeshniraula

    2025年4月24日   

    尼泊尔语词典数据集NepaliDictionaryDataset-rakeshniraula 数据来源:互联网公开数据 标签:语言学习,词典,数据集,尼泊尔语,词汇,教育,翻译,语言资源 数据概述: 该数据集包含来自尼泊尔语词典的数据,记录了尼泊尔语的词汇及其对应的释义和用法。主要特征如下: 时间跨度:数据记录的时间范围从词典的最初版本到最近更新。...
    packageimg
  • 词汇数据集Lexicon-CleanDataset-jvmchik

    2025年4月24日   

    词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
    packageimg
  • 印地语维基百科数据集HindiWikipediaDataset-vjdwary

    2025年4月23日   

    印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:...
    packageimg
  • 土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr

    2025年4月23日   

    土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:语言学,依存句法,自然语言处理,土耳其语,数据集,句法分析,语言资源,机器学习 数据概述: 该数据集包含土耳其语的通用依存树库,记录了土耳其语文本的依存句法结构。主要特征如下:...
    packageimg
  • 美国人口普查姓名数据集2000-2010

    2025年4月15日   

    美国人口普查姓名数据集2000-2010 数据来源:互联网公开数据 标签:美国人口普查,姓名,名字,姓氏,时间序列,数据清洗,语言资源 数据概述: 本数据集包含两个从美国人口普查获取的数据文件,以及三个从多元来源提取的.tsv文件。具体文件包括: - yob2000.txt:2000年美国人口普查中的男性和女性名字及其出现频率。 -...
    packageimg
  • 孟加拉语仇恨言论检测数据集

    2025年4月15日   

    孟加拉语仇恨言论检测数据集 数据来源:互联网公开数据 标签:仇恨言论检测,孟加拉语,社交媒体分析,文本分类,自然语言处理,机器学习,语言资源 数据概述: 本数据集(BD-...
    packageimg