-
计算机科学国际会议论文标题与摘要数据集-ICIST-2011-2013-2019-milanzdravkovic
计算机科学国际会议论文标题与摘要数据集-ICIST-2011-2013-2019-milanzdravkovic 数据来源:互联网公开数据 标签:计算机科学,论文,摘要,会议,文本挖掘,自然语言处理,学术研究,信息检索 数据概述: 本数据集收录了2011年至2019年间(2012年除外)国际信息社会与技术大会(ICIST, International... -
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析 数据概述:... -
StackOverflow开发者问答数据分析与标签分类数据集
StackOverflow开发者问答数据分析与标签分类数据集 数据来源:互联网公开数据 标签:Stack Overflow, 开发者问答, 编程, 技术, 标签, 数据分析, 自然语言处理, 信息检索 数据概述: 本数据集包含了从Stack Overflow网站抓取的大量问题数据,数据内容涵盖了开发者在Stack... -
亚马逊客户评论数据集
亚马逊客户评论数据集 数据来源:互联网公开数据 标签:电商平台,用户评论,情感分析,自然语言处理,信息检索,机器学习,产品体验,地域差异,促销意图 数据概述:... -
媒体偏见识别基准数据集
媒体偏见识别基准数据集 数据来源:互联网公开数据 标签:媒体偏见,基准数据集,自然语言处理,机器学习,文本分析,信息检索,偏见检测,多任务学习 数据概述: 本数据集是全球首个用于媒体偏见识别的统一基准数据集集合(MBIB - Media Bias Identification... -
自然问答数据集
自然问答数据集 数据来源:互联网公开数据 标签:自然问答,问答系统,自然语言处理,机器学习,数据预处理,问答生成,信息检索 数据概述: 本数据集由Google AI... -
维基百科页面数据集
维基百科页面数据集 数据来源:互联网公开数据 标签:维基百科,文本内容,自然语言处理,嵌入模型,信息检索,知识图谱,数据挖掘 数据概述: 本数据集基于Wikipedia页面内容构建,包含从原始竞赛数据集中提取的问答数据。数据集主要字段包括问题ID、维基百科页面建议、页面内容等。此外,数据集中还包含了通过Sentence-... -
维基百科关于谷歌的页面浏览量统计数据集-2023
维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:... -
-
WikiQA开放域问答数据集-问题与句子对-开放域问答研究
WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:... -
-
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:... -
IEEE研究论文数据集1963-2021
IEEE研究论文数据集1963-2021 数据来源:互联网公开数据 标签:IEEE,研究论文,工程技术,推荐系统,信息检索,NLP任务 数据概述:... -
问答一致性研究与文本理解数据集
问答一致性研究与文本理解数据集 数据来源:互联网公开数据 标签:问答任务,一致性评估,自然语言处理,机器学习,问答系统,文本理解,信息检索 数据概述: 本数据集专注于问答一致性研究,包含训练集和验证集两个部分。每个数据样本由三个关键字段组成: 1. 问题(question):用户提出的具体问题。 2. 答案(answer):对应问题的标准答案。 3.... -
马拉维公共卫生疾病监测与应对问答数据集2020
马拉维公共卫生疾病监测与应对问答数据集2020 数据来源:互联网公开数据 标签:马拉维,公共卫生,疾病监测,问答数据,文本分类,机器学习,信息检索,培训材料 数据概述:... -
跨领域多模态问答任务数据集2023
跨领域多模态问答任务数据集2023 数据来源:互联网公开数据 标签:问答系统,多模态数据,自然语言处理,机器学习,信息检索,HTML页面,跨领域 数据概述:... -
机器学习概率视角主题建模数据集
机器学习概率视角主题建模数据集 数据来源:互联网公开数据 标签:机器学习,概率视角,主题建模,内容识别,信息检索,文本聚类,教育资料 数据概述: 本数据集来源于《机器学习:概率视角》一书,收录了书中各个章节的标题及其对应的段落内容。该数据集为研究和应用机器学习技术提供了宝贵的文字资源,涵盖了广泛的机器学习主题。 数据用途概述:... -
比利时法定条款检索数据集BSARD
比利时法定条款检索数据集BSARD 数据来源:互联网公开数据 标签:法律问答,比利时,信息检索,自然语言处理,机器学习,法律研究 数据概述:... -
洪水信息检索系统数据集
洪水信息检索系统数据集 数据来源:互联网公开数据 标签:洪水,信息检索,机器学习,灾害分析,数据训练测试,二分类模型,网页内容分析 数据概述: 本数据集用于训练和测试一个二分类机器学习模型,旨在开发一个信息检索系统,用于检索包含美国过去洪水事件相关信息的网页。数据集涵盖了与洪水相关的网页内容,为研究和分析洪水现象提供了基础支持。 数据用途概述:... -
WebMD健康问答平台问题与解答数据集
WebMD健康问答平台问题与解答数据集 数据来源:互联网公开数据 标签:健康,医疗,问答,WebMD,医学,文本数据,自然语言处理,信息检索 数据概述:...