找到1,291个数据集

标签: 语料库

过滤结果
  • 命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03

    2025年4月25日   

    命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 质量控制语料库数据集QCCorpusDataset-ashokurlana

    2025年4月24日   

    质量控制语料库数据集QCCorpusDataset-ashokurlana 数据来源:互联网公开数据 标签:质量控制,语料库,数据集,自然语言处理,文本分析,机器学习,语言技术,数据标注 数据概述:该数据集包含来自质量控制领域的语料数据,记录了与质量控制相关的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu

    2025年4月24日   

    路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。...
    packageimg
  • 柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung

    2025年4月24日   

    柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung 数据来源:互联网公开数据 标签:诗歌,语料库,自然语言处理,文本分析,文学研究,情感分析,文本挖掘,数据集 数据概述: 该数据集包含英国浪漫主义诗人塞缪尔·泰勒·柯勒律治(Samuel Taylor Coleridge)的诗歌作品。主要特征如下:...
    packageimg
  • 拉丁语语料库数据集CorpusLatinDataset-nerdofdot

    2025年4月24日   

    拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:...
    packageimg
  • 大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100

    2025年4月24日   

    大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100 数据来源:互联网公开数据 标签:文本数据,多语种,自然语言处理,机器学习,语料库,文本分析,语言学,训练数据 数据概述: 该数据集包含大规模多语种文本训练数据,主要用于自然语言处理(NLP)模型的训练和评估。主要特征如下:...
    packageimg
  • 大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933

    2025年4月24日   

    大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933 数据来源:互联网公开数据 标签:自然语言处理,LLM,提示词,数据集,文本生成,人工智能,机器学习,语料库,Prompt 数据概述:...
    packageimg
  • 可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit

    2025年4月24日   

    可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:...
    packageimg
  • 自然语言处理数据集ANLP概览-ankitmakhija98

    2025年4月24日   

    自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:...
    packageimg
  • 豪萨语语料库数据集HausaCorporaDataset-isadutse

    2025年4月24日   

    豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 维基百科句子数据集WikiSentencesDataset-sgedela

    2025年4月24日   

    维基百科句子数据集WikiSentencesDataset-sgedela 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,句子,语言模型,文本分析,机器学习,语料库 数据概述:该数据集包含来自维基百科的句子数据,旨在为自然语言处理任务提供高质量的文本语料库。主要特征如下:...
    packageimg
  • 西班牙国会发言标点检测数据集

    2025年4月24日   

    西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1....
    packageimg
  • 阿塞拜疆语词汇库数据集-slyce20

    2025年4月24日   

    阿塞拜疆语词汇库数据集-slyce20 数据来源:互联网公开数据 标签:阿塞拜疆语,词汇,语言学,文本数据,语料库,自然语言处理,词典 数据概述: 本数据集包含8.2万个阿塞拜疆语单词,构成了一个基础的词汇库。数据集涵盖了阿塞拜疆语的常用词汇,为语言研究和相关应用提供了基础数据。 数据用途概述:...
    packageimg
  • 文学作品按体裁分类数据集-mehedihasan9021

    2025年4月23日   

    文学作品按体裁分类数据集-mehedihasan9021 数据来源:互联网公开数据 标签:文学,数据集,文本分析,自然语言处理,情感分析,分类,语料库,文本挖掘 数据概述: 该数据集包含按体裁分类的文学作品数据,旨在为文本分析和自然语言处理研究提供丰富的语料。主要特征如下: 时间跨度:数据涵盖不同时期和时代的文学作品。...
    packageimg
  • 印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3

    2025年4月23日   

    印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3 数据来源:互联网公开数据 标签:印尼语,语料库,文本数据,自然语言处理,语言学,词汇分析,文本挖掘,机器学习 数据概述: 该数据集收录了来自印尼语语料库 Nusantara (Korpus Nusantara)...
    packageimg
  • 汉字华语处理句对数据集-yuweiiizz

    2025年4月23日   

    汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:...
    packageimg
  • 自然语言处理示例数据集NLPSampleData-fishercht

    2025年4月23日   

    自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:...
    packageimg