找到611个数据集

标签: 信息检索

过滤结果
  • 电影推荐系统数据集MoviesRecommenderDataset-mohdfirhat

    2025年4月25日   

    电影推荐系统数据集MoviesRecommenderDataset-mohdfirhat 数据来源:互联网公开数据 标签:电影推荐,数据集,用户行为,协同过滤,机器学习,数据挖掘,个性化推荐,信息检索 数据概述: 该数据集包含来自电影推荐系统的用户行为数据,记录了用户对电影的评价,评分及交互信息。主要特征如下:...
    packageimg
  • 文档分类数据集DocClassificationDataset-aryangaikwad

    2025年4月25日   

    文档分类数据集DocClassificationDataset-aryangaikwad 数据来源:互联网公开数据 标签:文档分类,数据集,自然语言处理,机器学习,文本分析,信息检索,文本分类,人工智能 数据概述: 该数据集包含来自多个来源的文档数据,记录了各类文档的文本内容和类别标签。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 国际新闻分析数据集NewsCountryDataset-emreasln

    2025年4月25日   

    国际新闻分析数据集NewsCountryDataset-emreasln 数据来源:互联网公开数据 标签:新闻分析,国际新闻,数据集,文本挖掘,自然语言处理,全球政治,事件检测,信息检索 数据概述:该数据集包含来自全球多个主要新闻网站和媒体平台的国际新闻报道,记录了不同国家和地区的重要新闻事件和动态。主要特征如下:...
    packageimg
  • 家得宝产品搜索描述数据集HomeDepotProductSearchDescriptionDataset-riteshpatil8998

    2025年4月25日   

    家得宝产品搜索描述数据集HomeDepotProductSearchDescriptionDataset-riteshpatil8998 数据来源:互联网公开数据 标签:零售业,产品搜索,数据集,文本挖掘,自然语言处理,信息检索,机器学习,电商 数据概述: 该数据集包含了家得宝(Home...
    packageimg
  • 垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u

    2025年4月25日   

    垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,电子邮件,文本分类,自然语言处理,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开邮箱的垃圾邮件(Spam)和正常邮件(Ham)数据,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • BBC新闻数据集BBCNewsDataset-shineucc

    2025年4月25日   

    BBC新闻数据集BBCNewsDataset-shineucc 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,媒体研究,情感分析,信息检索 数据概述:该数据集包含来自BBC新闻网站的新闻文章数据,记录了不同类别新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 新闻文章内容相似度分析矩阵数据集-manishkumar866115

    2025年4月25日   

    新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。...
    packageimg
  • 问答数据集涵盖广泛主题的高质量问答内容

    2025年4月25日   

    标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据...
    packageimg
  • 俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina

    2025年4月25日   

    俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:...
    packageimg
  • 印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002

    2025年4月25日   

    印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本分析,印度新闻,数据集,机器翻译,文本分类,信息检索 数据概述: 该数据集包含来自Inshorts平台的印度新闻摘要数据,用于文本摘要,自然语言处理等任务。主要特征如下:...
    packageimg
  • 预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

    2025年4月25日   

    预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源:互联网公开数据 标签:预训练,标签,数据集,自然语言处理,文本分类,信息检索,机器学习,深度学习 数据概述: 该数据集包含了用于预训练的标签数据,旨在支持各种自然语言处理任务,例如文本分类,信息检索等。主要特征如下: 时间跨度:...
    packageimg
  • 知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry

    2025年4月25日   

    知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry 数据来源:互联网公开数据 标签:知识竞赛,问答数据,数据集,自然语言处理,文本挖掘,机器学习,教育技术,信息检索 数据概述: 该数据集包含来自知识竞赛节目《Jeopardy!》的问答数据,记录了节目中提出的各类问题及其对应的答案。主要特征如下:...
    packageimg
  • 跨领域开放域问答数据集COSMOSQADataset-sidop21

    2025年4月25日   

    跨领域开放域问答数据集COSMOSQADataset-sidop21 数据来源:互联网公开数据 标签:开放域问答,自然语言处理,数据集,机器学习,对话系统,信息检索,文本理解,知识图谱 数据概述: 该数据集包含来自COSMOS项目的开放域问答数据,记录了用户提出的各种问题及其对应的答案。主要特征如下:...
    packageimg
  • 阿拉伯语新闻分类数据集-essasartawi

    2025年4月25日   

    阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 图卢维基百科数据转储2023年数据集-moreducks

    2025年4月25日   

    图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...
    packageimg
  • 国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi

    2025年4月25日   

    国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi 数据来源:互联网公开数据 标签:论文引用,数据集,学术研究,文献计量学,网络分析,机器学习,自然语言处理,信息检索 数据概述:...
    packageimg
  • 内容推荐系统数据集Content-BasedRecommendationDataset-denizmac

    2025年4月25日   

    内容推荐系统数据集Content-BasedRecommendationDataset-denizmac 数据来源:互联网公开数据 标签:推荐系统,内容推荐,数据集,机器学习,用户行为,文本分析,信息检索,自然语言处理 数据概述:该数据集包含来自多个来源的用户内容互动数据,记录了用户与内容项之间的交互信息。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集-salonimourya

    2025年4月25日   

    电子邮件垃圾邮件检测数据集-salonimourya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,自然语言处理,机器学习,信息检索,数据挖掘 数据概述: 该数据集包含电子邮件数据,用于垃圾邮件检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电子邮件产生的历史数据。...
    packageimg
  • 元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018

    2025年4月25日   

    元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018 数据来源:互联网公开数据 标签:数据管理,知识图谱,元数据,数据集,信息检索,机器学习,语义分析,数据处理 数据概述: 该数据集由Metzoo项目提供,专注于元数据管理和知识图谱构建任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg