找到610个数据集

分类: 互联网数据 标签: 信息检索

过滤结果
  • 问答匹配与答案推荐数据集

    2025年9月6日 30 25 15

    问答匹配与答案推荐数据集_Question_Answering_Matching_and_Answer_Recommendation_Dataset 数据来源:互联网公开数据 标签:问答系统, 文本匹配, 答案推荐, 自然语言处理, 机器学习, 信息检索, 数据标注, 关系抽取 数据概述:...
    packageimg
  • 文本检索模型评估结果数据集

    2025年9月3日 30 173 99

    文本检索模型评估结果数据集_Text_Retrieval_Model_Evaluation_Results 数据来源:互联网公开数据 标签:文本检索, 信息检索, 模型评估, 语义相似度, 深度学习, 机器翻译, 知识图谱, 性能分析 数据概述:...
    packageimg
  • 教育出版物文本信息数据集

    2025年8月30日 30 127 34

    教育出版物文本信息数据集_Education_Publications_Text_Information 数据来源:互联网公开数据 标签:教育, 出版物, 文本分析, 信息检索, 自然语言处理, 知识图谱, 机器学习, 文本摘要 数据概述: 该数据集包含来自教育出版物的文本信息,记录了出版物的标题、章节标题和文本内容。主要特征如下:...
    packageimg
  • arXiv学术论文元数据分析数据集

    2025年8月25日 30 93 75

    arXiv学术论文元数据分析数据集_arXiv_Academic_Paper_Metadata_Analysis_Dataset 数据来源:互联网公开数据 标签:学术论文, 元数据, arXiv, 自然语言处理, 文本挖掘, 学术研究, 论文分析, 信息检索 数据概述:...
    packageimg
  • 文本信息匹配结果评估数据集

    2025年8月21日 30 175 23

    文本信息匹配结果评估数据集_Text_Information_Matching_Evaluation_Results 数据来源:互联网公开数据 标签:文本匹配, 信息检索, 自然语言处理, 机器阅读理解, 模型评估, 深度学习, 关系抽取, 标注数据 数据概述:...
    packageimg
  • 维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx

    2025年4月26日 30 101 73

    维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx 数据来源:互联网公开数据 标签:知识图谱,维基百科,数据集,语义网络,数据挖掘,自然语言处理,人工智能,信息检索 数据概述: 该数据集包含来自维基百科的知识图谱数据,记录了维基百科中实体的属性和关系。主要特征如下:...
    packageimg
  • 越南语堤坝安全问答数据集

    2025年8月13日 30 95 66

    越南语堤坝安全问答数据集_Vietnamese_Dam_Safety_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 堤坝安全, 文本处理, 越南语, 信息检索, 灾害管理, 语义理解 数据概述:...
    packageimg
  • 新闻摘要生成数据集

    2025年8月12日 30 79 74

    新闻摘要生成数据集_News_Summary_Generation_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 机器翻译, 文本生成, 深度学习, 语料库, 信息检索 数据概述: 该数据集包含来自新闻文章的数据,记录了新闻文章原文及其对应的摘要。主要特征如下:...
    packageimg
  • 孟加拉语文本生成警局电话信息数据集

    2025年8月10日 30 71 15

    孟加拉语文本生成警局电话信息数据集_Bengali_Text_Generation_Police_Station_Phone_Information 数据来源:互联网公开数据 标签:文本生成, 孟加拉语, 自然语言处理, 问答系统, 信息检索, 数据集, 对话生成, 机器翻译 数据概述:...
    packageimg
  • 俄语新闻文本关键词提取数据集

    2025年7月27日 30 170 76

    俄语新闻文本关键词提取数据集_Russian_News_Text_Keyword_Extraction_Dataset 数据来源:互联网公开数据 标签:文本分析, 关键词提取, 自然语言处理, 俄语, 新闻, 文本挖掘, 语料库, 信息检索 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,主要用于关键词提取和文本分析任务。主要特征如下:...
    packageimg
  • 用户提问与答案匹配数据集

    2025年7月25日 30 169 150

    用户提问与答案匹配数据集_User_Question_and_Answer_Matching 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 信息检索, 对话分析, 语义理解, 机器学习, 数据标注 数据概述: 该数据集包含用户提问与对应答案的数据,记录了用户在特定场景下提出的问题及其相应的解答。主要特征如下:...
    packageimg
  • 知识内容关联预测数据集

    2025年7月22日 30 35 23

    知识内容关联预测数据集_Knowledge_Content_Association_Prediction_Dataset 数据来源:互联网公开数据 标签:内容推荐, 知识图谱, 文本匹配, 机器学习, 自然语言处理, 教育, 信息检索, 数据挖掘 数据概述:...
    packageimg
  • 文本语义相似度评估数据集

    2025年7月17日 30 119 96

    文本语义相似度评估数据集_Text_Semantic_Similarity_Evaluation 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 信息检索, 模型评估, 深度学习, 自然语言处理, 评估指标, 对比分析 数据概述: 该数据集包含用于评估文本语义相似度模型的训练与评估数据,主要聚焦于信息检索场景下的模型性能分析。主要特征如下:...
    packageimg
  • 学术论文标题摘要分析数据集

    2025年7月12日 30 5 2

    学术论文标题摘要分析数据集_Academic_Paper_Title_Abstract_Analysis 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 摘要分析, 标题关键词, 文本挖掘, 学术研究, 信息检索 数据概述: 该数据集包含来自学术论文的数据,记录了论文的标题和摘要信息,用于文本分析和信息检索任务。主要特征如下:...
    packageimg
  • 考试题目文本分析数据集

    2025年7月2日 30 75 59

    考试题目文本分析数据集_Examination_Questions_Text_Analysis 数据来源:互联网公开数据 标签:考试题目, 文本分析, 自然语言处理, 问答系统, 文本分类, 语义理解, 数据挖掘, 信息检索 数据概述: 该数据集包含考试题目文本数据,记录了用于学术研究和应用开发的考试题目内容。主要特征如下:...
    packageimg
  • 文本片段索引信息数据集

    2025年6月30日 30 22 20

    文本片段索引信息数据集_Text_Segment_Index_Information 数据来源:互联网公开数据 标签:文本处理, 信息检索, 索引构建, 数据结构, 文本分析, 机器学习, 自然语言处理, 数据集 数据概述: 该数据集包含文本片段的索引信息,记录了文本被分割成片段后的关键索引数据。主要特征如下:...
    packageimg
  • 冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset

    2025年6月25日 30 46 28

    冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 事件抽取, 冬奥会, 信息检索, 机器学习, 数据集 数据概述: 该数据集包含从新闻报道和相关资料中提取的问答对,记录了关于冬季奥运会的相关信息。主要特征如下:...
    packageimg
  • 孟加拉语新闻分类数据集1963-2021

    2025年4月14日 60 37 12

    孟加拉语新闻分类数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,新闻分类,NLP,机器学习,文本分析,情感分析,信息检索,语言建模 数据概述: 本数据集收录了来自Jamuna...
    packageimg
  • 俄罗斯StackExchange数据集

    2025年6月4日 30 57 21

    俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:...
    packageimg
  • 多语言歌词音乐流派分类数据集-mateibejan

    2025年6月1日 30 40 2

    多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:...
    packageimg