找到600个数据集

标签: 信息检索

过滤结果
  • 证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12

    2025年4月24日   

    证据处理流程数据集DataProcessforEvidenceDataset-davidnguyens12 数据来源:互联网公开数据 标签:证据处理,数据集,文本分析,自然语言处理,信息检索,司法,机器学习,数据清洗 数据概述: 该数据集包含了用于证据处理流程的数据,记录了从原始证据到分析结果的各个环节。主要特征如下:...
    packageimg
  • 问题与答案链接数据集QuestionandAnswerURLsDataset-aniken

    2025年4月24日   

    问题与答案链接数据集QuestionandAnswerURLsDataset-aniken 数据来源:互联网公开数据 标签:问答数据,数据集,网络爬取,文本分析,信息检索,机器学习,自然语言处理,知识图谱 数据概述: 该数据集包含来自互联网的问答数据,记录了各种问题及其对应的答案链接。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。...
    packageimg
  • 电影问答与对话系统数据集RAGMovieContextDataset-vantanle71

    2025年4月24日   

    电影问答与对话系统数据集RAGMovieContextDataset-vantanle71 数据来源:互联网公开数据 标签:电影,问答系统,数据集,自然语言处理,对话系统,信息检索,人工智能,机器学习 数据概述: 该数据集包含来自电影领域的对话和问答数据,记录了电影相关信息和用户提问的回答。主要特征如下:...
    packageimg
  • 英-马尔地语双语翻译数据集-mayakaripel

    2025年4月24日   

    英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-...
    packageimg
  • 国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn

    2025年4月24日   

    国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源:互联网公开数据 标签:法律文本,信息检索,图卷积网络,数据集,自然语言处理,机器学习,法律科技,文本分析 数据概述: 该数据集来源于国际法律信息检索竞赛(COLIEE...
    packageimg
  • PDF文档摘要提取数据集DrivePDFDataset-atif10

    2025年4月24日   

    PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...
    packageimg
  • Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu

    2025年4月24日   

    Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,深度学习,语义分析 数据概述: 该数据集包含来自Quora平台的问答数据,记录了平台上用户提出的问题及其标签。主要特征如下:...
    packageimg
  • 医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel

    2025年4月24日   

    医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel 数据来源:互联网公开数据 标签:医学,问答系统,数据集,人工智能,自然语言处理,健康咨询,机器学习,信息检索 数据概述: 该数据集包含来自医学领域的问答数据,记录了用户提出的医学相关问题及其对应的专家回答。主要特征如下:...
    packageimg
  • 标题与期刊论文数据集TitleandJournalDataset-boa234

    2025年4月24日   

    标题与期刊论文数据集TitleandJournalDataset-boa234 数据来源:互联网公开数据 标签:期刊论文,标题分析,数据集,学术研究,文本挖掘,自然语言处理,信息检索,学术资源 数据概述: 该数据集包含来自多个学术期刊的论文标题数据,记录了各类期刊论文的标题信息。主要特征如下: 时间跨度: 数据记录的时间范围从2000年到2022年。...
    packageimg
  • 关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710

    2025年4月24日   

    关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710 数据来源:互联网公开数据 标签:自然语言处理,文本分析,关键词提取,数据集,机器学习,文本摘要,信息检索,人工智能 数据概述: 该数据集专注于自然语言处理领域,主要记录了文本中的关键词提取和文本摘要任务所需的数据。主要特征如下:...
    packageimg
  • WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu

    2025年4月24日   

    WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu 数据来源:互联网公开数据 标签:SQL查询,数据集,数据库,自然语言处理,信息检索,机器学习,模式匹配,数据分析 数据概述: 该数据集由 WikiSQLSpider 项目提供,主要记录了从自然语言问题到 SQL 查询的转换数据,适用于 SQL...
    packageimg
  • 知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy

    2025年4月24日   

    知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:...
    packageimg
  • 邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan

    2025年4月24日   

    邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。...
    packageimg
  • 问答数据集QuestionAnsweringDataset-namphmquang

    2025年4月24日   

    问答数据集QuestionAnsweringDataset-namphmquang 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,语言模型,知识库,信息检索,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3

    2025年4月24日   

    股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3 数据来源:互联网公开数据 标签:股票情绪分析,新闻标题,数据集,金融分析,自然语言处理,机器学习,投资决策,信息检索 数据概述: 该数据集包含新闻标题,用于分析新闻报道对股票市场情绪的影响。主要特征如下:...
    packageimg
  • 影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti

    2025年4月24日   

    影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti 数据来源:互联网公开数据 标签:影视分析,元数据,数据集,数据挖掘,机器学习,信息检索,文化产业,统计分析 数据概述: 该数据集包含来自电影数据库的元数据,记录了电影作品的关键信息。主要特征如下:...
    packageimg
  • 维基百科句子数据集WikiSentencesV2-ranjitp20

    2025年4月24日   

    维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:...
    packageimg
  • 商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141

    2025年4月24日   

    商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:...
    packageimg
  • 自助文章问题解决与建议数据集-greatcodes

    2025年4月23日   

    自助文章问题解决与建议数据集-greatcodes 数据来源:互联网公开数据 标签:自助,健康,移民,个人护理,问题解决,建议,文本分类,信息检索,内容分析,文本摘要 数据概述:...
    packageimg
  • 谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc

    2025年4月23日   

    谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc 数据来源:互联网公开数据 标签:互联网搜索,数据集,趋势分析,用户行为,数据分析,市场研究,信息检索,社会热点 数据概述: 该数据集包含来自谷歌趋势(Google...
    packageimg