找到11,898个数据集

标签: 自然语言处理

过滤结果
  • 领英招聘信息数据集LinkedInJobsDataset-samssj10

    2025年4月26日   

    领英招聘信息数据集LinkedInJobsDataset-samssj10 数据来源:互联网公开数据 标签:招聘,领英,职位,数据集,自然语言处理,机器学习,职业发展,就业市场 数据概述: 该数据集包含来自领英(LinkedIn)平台的公开招聘信息,记录了不同行业,不同地区和不同职位的招聘详情。主要特征如下:...
    packageimg
  • 印尼短信垃圾邮件数据集-bobsteward

    2025年4月26日   

    印尼短信垃圾邮件数据集-bobsteward 数据来源:互联网公开数据 标签:短信垃圾邮件,文本分类,自然语言处理,机器学习,印尼语,数据集,垃圾短信检测,信息安全 数据概述: 该数据集包含来自印度尼西亚的短信数据,旨在用于垃圾短信检测和文本分类研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,但可推断为数据集创建时的近期时间段。...
    packageimg
  • 文化遗产文本情感分析数据集-raghadsaeed

    2025年4月26日   

    文化遗产文本情感分析数据集-raghadsaeed 数据来源:互联网公开数据 标签:文化遗产,文本分析,情感分析,自然语言处理,机器学习,文化研究,语料库,情感标注 数据概述:该数据集包含来自互联网的文化遗产相关文本,主要用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期和不同来源的文化遗产相关文本。...
    packageimg
  • 新闻数据集Well-ShuffledNewsDataset-nushrathussain

    2025年4月26日   

    新闻数据集Well-ShuffledNewsDataset-nushrathussain 数据来源:互联网公开数据 标签:新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,数据分析,社会科学研究 数据概述: 该数据集包含来自多个来源的新闻文章,记录了不同类型和主题的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 网络欺凌监测数据集邙文社交媒体评论2023年ML-Cyberbullying-Bangla-Social-Media-Comments-CSV2023年-...

    2025年4月26日   

    网络欺凌监测数据集邙文社交媒体评论2023年ML-Cyberbullying-Bangla-Social-Media-Comments-CSV2023年-saifulislam7 数据来源:互联网公开数据 标签:网络欺凌,社交媒体,评论分析,自然语言处理,机器学习,数据集,社交媒体监控,数据分析...
    packageimg
  • 情感分析数据集EmotionDataTrueDataset-sayou1314

    2025年4月26日   

    情感分析数据集EmotionDataTrueDataset-sayou1314 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本分类,机器学习,情感识别,中文文本,情感标注 数据概述: 该数据集包含经过人工标注的中文文本情感数据,用于情感分析任务。主要特征如下: 时间跨度:...
    packageimg
  • UNIR学习图书数据集BooksDatasetforUNIR-wolverinemtb

    2025年4月26日   

    UNIR学习图书数据集BooksDatasetforUNIR-wolverinemtb 数据来源:互联网公开数据 标签:图书,教育,数据集,学术资源,学习,文本分析,自然语言处理,知识图谱 数据概述: 该数据集包含了UNIR(西班牙国际大学)学习资源相关的图书信息。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了UNIR教学使用的图书,时间范围不定。...
    packageimg
  • HuggingFace预训练模型数据集BERT-xenxiou

    2025年4月26日   

    HuggingFace预训练模型数据集BERT-xenxiou 数据来源:互联网公开数据 标签:自然语言处理,数据集,预训练模型,BERT,文本分析,机器学习,语言模型,Transformer 数据概述: 该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下:...
    packageimg
  • 巴西疫苗接种推文数据集Tweets-VacinajaDataset-unanimad

    2025年4月26日   

    巴西疫苗接种推文数据集Tweets-VacinajaDataset-unanimad 数据来源:互联网公开数据 标签:疫苗接种,推文,社交媒体,巴西,公共卫生,自然语言处理,情感分析,数据挖掘 数据概述: 该数据集包含来自巴西社交媒体平台推文数据,记录了关于疫苗接种相关的讨论和信息。主要特征如下:...
    packageimg
  • 社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach

    2025年4月26日   

    社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach 数据来源:互联网公开数据 标签:图像描述,翻译,社交媒体,数据集,自然语言处理,机器翻译,多语言,计算机视觉 数据概述:该数据集包含来自Flickr平台的图片及其描述,并提供了相应描述的尼泊尔语翻译。主要特征如下:...
    packageimg
  • 维基多语言文本分类数据集-2018

    2025年4月26日   

    维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:...
    packageimg
  • 孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi

    2025年4月26日   

    孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi 数据来源:互联网公开数据 标签:孟加拉语,词形还原,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自孟加拉语书籍的词形还原数据,记录了孟加拉语文本中单词的词形还原结果。主要特征如下:...
    packageimg
  • 学生写作能力评估数据集DatasetStudentWriting2-renokan

    2025年4月26日   

    学生写作能力评估数据集DatasetStudentWriting2-renokan 数据来源:互联网公开数据 标签:教育,写作能力,数据集,评估,机器学习,文本分析,自然语言处理,学生表现 数据概述:该数据集包含来自学生写作能力评估项目的数据,记录了学生在写作任务中的表现和评估结果。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • 幻觉与原始语言概率数据集HallucinationswithRawLanguageProbsDataset-romhim

    2025年4月26日   

    幻觉与原始语言概率数据集HallucinationswithRawLanguageProbsDataset-romhim 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,概率模型,语言理解,文本生成,人工智能,深度学习 数据概述:...
    packageimg
  • 金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19

    2025年4月26日   

    金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19 数据来源:互联网公开数据 标签:金融问答,多跳推理,数据集,自然语言处理,机器学习,问答系统,金融分析,信息检索 数据概述:该数据集包含来自多个金融领域的问答数据,特别适用于需要多步推理的复杂金融问题解答。主要特征如下:...
    packageimg
  • 多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta

    2025年4月26日   

    多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta 数据来源:互联网公开数据 标签:机器学习,自然语言处理,阅读理解,多语言,印地语,问答系统,数据集,人工智能 数据概述:...
    packageimg
  • 书籍嵌入数据集EmbeddingBookData-jojoyin

    2025年4月26日   

    书籍嵌入数据集EmbeddingBookData-jojoyin 数据来源:互联网公开数据 标签:书籍,嵌入,自然语言处理,文本分析,机器学习,推荐系统,语义相似度,数据集 数据概述: 该数据集包含书籍的嵌入表示,旨在捕捉书籍在语义空间中的关系。主要特征如下: 时间跨度:数据记录无明确时间范围,主要基于书籍内容构建嵌入。...
    packageimg
  • 词嵌入训练数据集-akalyasubramanian

    2025年4月26日   

    词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:...
    packageimg
  • 视频嵌入数据集GetVideoEmbeddingsData-garvk123

    2025年4月26日   

    视频嵌入数据集GetVideoEmbeddingsData-garvk123 数据来源:互联网公开数据 标签:视频分析,数据集,嵌入,机器学习,计算机视觉,视频检索,自然语言处理,多模态 数据概述: 该数据集包含视频及其对应的嵌入向量,旨在用于视频分析,理解和检索任务。主要特征如下:...
    packageimg
  • 土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca

    2025年4月26日   

    土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,用户分析,文本分析,机器学习,自然语言处理,社会学 数据概述:...
    packageimg