找到601个数据集

标签: 信息检索

过滤结果
  • 新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha

    2025年4月26日   

    新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,数据挖掘,信息检索,媒体研究 数据概述: 该数据集包含来自公开新闻来源的清洗后数据,记录了各类新闻文章的详细分类信息。主要特征如下:...
    packageimg
  • IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia

    2025年4月26日   

    IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,自然语言处理,文本挖掘,情感分析,机器学习,信息检索 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影剧情摘要数据,记录了数千部电影的剧情简介和相关信息。主要特征如下:...
    packageimg
  • 样本问答数据集SampledQADataDataset-hritik619916

    2025年4月26日   

    样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...
    packageimg
  • 虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi

    2025年4月26日   

    虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,信息检索 数据概述: 该数据集包含了来自不同来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
    packageimg
  • 事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701

    2025年4月26日   

    事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701 数据来源:互联网公开数据 标签:事实核查,表格理解,零样本学习,自然语言处理,数据集,信息检索,人工智能,文本分析 数据概述: 该数据集源自TabFact项目,专注于表格事实核查任务,特别是在零上下文设置下进行。主要特征如下:...
    packageimg
  • 垃圾邮件过滤数据集-aymendernani

    2025年4月26日   

    垃圾邮件过滤数据集-aymendernani 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,邮件过滤,数据集,信息检索,人工智能 数据概述: 该数据集包含来自不同来源的邮件数据,用于垃圾邮件过滤任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期的邮件数据。...
    packageimg
  • 相似性数据集SimilarityDataDataset-sagarrathore

    2025年4月26日   

    相似性数据集SimilarityDataDataset-sagarrathore 数据来源:互联网公开数据 标签:相似性分析,数据集,模式识别,机器学习,数据挖掘,信息检索,人工智能,统计分析 数据概述: 该数据集包含来自多个领域的相似性数据,记录了不同对象或特征之间的相似度或关联度。主要特征如下:...
    packageimg
  • 齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari

    2025年4月26日   

    齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:...
    packageimg
  • 科学文本分类数据集ScientificTextClassificationDataset-chiragb254

    2025年4月26日   

    科学文本分类数据集ScientificTextClassificationDataset-chiragb254 数据来源:互联网公开数据 标签:科学文本,数据集,文本分类,机器学习,自然语言处理,数据挖掘,学术研究,信息检索 数据概述:...
    packageimg
  • 数据1985年阿尔巴尼亚百科全书数据集-ashahini

    2025年4月26日   

    1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:...
    packageimg
  • 文档主题模型矩阵数据集DocumentTopicModelMatrixDataset-rhythm004

    2025年4月26日   

    文档主题模型矩阵数据集DocumentTopicModelMatrixDataset-rhythm004 数据来源:互联网公开数据 标签:主题模型,数据集,自然语言处理,文本分析,机器学习,信息检索,文本挖掘,统计建模 数据概述: 该数据集包含文档主题模型矩阵,记录了文本数据在主题模型下的表示。主要特征如下:...
    packageimg
  • 无词干提取文本数据集DatasetTanpaStemming-skripsheet

    2025年4月26日   

    无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:...
    packageimg
  • 数据2020年6月1日维基百科特色文章数据集-gabrielaltay

    2025年4月26日   

    2020年6月1日维基百科特色文章数据集-gabrielaltay 数据来源:互联网公开数据 标签:维基百科,特色文章,数据集,自然语言处理,文本分析,信息检索,内容挖掘,知识图谱 数据概述:该数据集包含来自维基百科的特色文章数据,记录了截至2020年6月1日的维基百科特色文章的详细信息。主要特征如下:...
    packageimg
  • 新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray

    2025年4月26日   

    新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray 数据来源:互联网公开数据 标签:新闻分类,数据集,文本挖掘,自然语言处理,机器学习,新闻媒体,信息检索,文本分析 数据概述: 该数据集包含来自多个新闻和杂志来源的文章数据,记录了不同类别新闻和杂志文章的内容信息。主要特征如下:...
    packageimg
  • 开放数据集元数据分析数据集OpenDatasetMetadataAnalysisDataset-amandaphaladi

    2025年4月26日   

    开放数据集元数据分析数据集OpenDatasetMetadataAnalysisDataset-amandaphaladi 数据来源:互联网公开数据 标签:元数据,数据集,数据分析,数据治理,数据质量,信息检索,数据挖掘,开放数据 数据概述: 该数据集包含来自多个开放数据平台的元数据信息,用于分析和研究数据集的特征,质量和使用情况。主要特征如下:...
    packageimg
  • 印度所有学院列表数据集ListofAllIndianCollegesDataset-insolfrac

    2025年4月26日   

    印度所有学院列表数据集ListofAllIndianCollegesDataset-insolfrac 数据来源:互联网公开数据 标签:教育,学院,数据集,高等教育,资源整理,地理分布,信息检索,统计分析 数据概述: 该数据集包含来自公开教育资源的印度所有学院的详细信息,记录了印度各地学院的全面列表。主要特征如下: 时间跨度:...
    packageimg
  • 测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05

    2025年4月26日   

    测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05 数据来源:互联网公开数据 标签:查询分析,数据集,信息检索,机器学习,搜索引擎,自然语言处理,人工智能,数据科学 数据概述:该数据集包含了一系列测试查询及其真实结果,适用于信息检索,搜索引擎优化和自然语言处理等任务。主要特征如下:...
    packageimg
  • Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17

    2025年4月26日   

    Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述:...
    packageimg
  • Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit

    2025年4月26日   

    Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit 数据来源:互联网公开数据 标签:问答数据,自然语言处理,数据集,文本分析,机器学习,信息检索,知识图谱,社区互动 数据概述: 该数据集包含来自Quora平台的用户提问及回答数据,记录了平台上的问答互动内容。主要特征如下:...
    packageimg
  • 无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147

    2025年4月26日   

    无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:...
    packageimg