找到614个数据集

标签: 问答系统

过滤结果
  • ECQuAD_GoBots_Based_巴西电商问答阅读理解开发数据集

    2026年1月26日   

    数据集概述 本数据集是针对巴西电商平台的阅读理解问答数据集(ECQuAD),由众包工作者基于商品描述标注问题,遵循SQuAD-v2格式,包含可回答与不可回答问题。数据集为开发版本,供公开使用,由GoBots提供,仅含一个文件。 文件详解 文件名称:ecquad_dev_v2.json 文件格式:JSON...
    packageimg
  • Spanish_Workers_Statute_Based_双语问答数据集

    2026年1月21日   

    数据集概述 本数据集为西班牙语劳动法关键文件的双语问答数据集,包含150个问题及其对应答案,答案形式为西班牙《工人法规》130个部分中的条款编号及相关摘录。数据集支持信息检索与问答任务,共包含3个文件。 文件详解 Extracted Terminology of Spanish Worker Statute.txt 文件格式:TXT...
    packageimg
  • Serial_Speakers_Source_TV剧集标注数据集_2020

    2026年1月21日   

    数据集概述 本数据集包含《绝命毒师》《权力的游戏》《纸牌屋》3部电视剧的人工标注数据,涵盖剧集的季、集、场景、镜头及语音片段等结构化信息,所有文件为JSON格式,语音文本因版权加密处理,可通过指定工具恢复。 文件详解 文件名称:bb.json 文件格式:JSON...
    packageimg
  • BioStars_API_Based_生物信息学论坛问答数据20220327

    2026年1月20日   

    数据集概述 本数据集为BioStars问答论坛API输出内容,涵盖截至帖子ID(UID)9557161的论坛数据,包含生物信息学、计算基因组学及生物数据分析相关的问答内容。数据集由Zenodo平台发布,遵循BioStars内容许可协议,不含9463943至494831号ID的内容,总计包含一个JSON文件。 文件详解...
    packageimg
  • OfficeDial_Taskmaster_Based_多噪声场景人机对话数据集

    2026年1月19日   

    数据集概述 本数据集为json格式文件,包含用户与智能语音助手(IVA)在不同噪声场景下的对话内容,格式适配自Taskmaster数据集结构。数据以对话为核心单元,记录对话ID、场景类型、噪声等级及多轮 utterance 信息,可用于智能语音交互系统的鲁棒性分析与优化。 文件详解 README.md 文件格式:Markdown...
    packageimg
  • Replication_Package_Discord开发者问答辅助研究复现包数据

    2026年1月15日   

    数据集概述 本数据集是论文“On the Helpfulness of Answering Developer Questions on Discord with Similar Conversations and Posts from the...
    packageimg
  • French_trainset_Based_法语银行信用卡常见请求客服对话训练数据集

    2026年1月14日   

    数据集概述 本数据集为法语银行信用卡客服对话训练数据,包含10个意图类别,每个类别100条法语问题,共1000条客户常见请求示例。意图覆盖卡片遗失/被盗、吞卡、办卡、余额查询等信用卡管理场景,可用于训练处理银行信用卡常用请求的智能客服模型。 文件详解...
    packageimg
  • Question_Answering_SNIK_Based_医疗信息管理本体问答数据集

    2026年1月14日   

    数据集概述 本数据集为基于SNIK医疗信息管理本体的问答系统相关数据,包含问答操作所用数据、训练问题及按问题类型通过特定指标完成的评估结果,涉及CSV、JSON、NT三种格式共12个文件,可用于SNIK本体问答系统的训练与性能分析。 文件详解 CSV文件(共8个) 部分文件名称:textbook-...
    packageimg
  • GeoQuestions1089_Based_YAGO2geo地理空间问答数据集_v1_1

    2026年1月13日   

    数据集概述 本数据集是面向YAGO2geo知识图谱的众包地理空间问答数据集,包含1089组地理空间问题、对应答案及SPARQL/GeoSPARQL查询语句,可用于地理空间问答引擎的基准测试,提供v1.1版本,共2个JSON文件。 文件详解 文件名称:GeoQuestions1089.json 文件格式:JSON...
    packageimg
  • DBpedia_Conversation_Question_Answering_Dataset

    2026年1月12日   

    数据集概述 本数据集基于DBpedia构建,包含一百一十五个问题及五十组对话内容,用于支持对话式问答相关研究。数据集以单一JSON文件形式存储,未划分训练/测试集、数据/标签集或原始/处理集,可直接用于对话式问答模型的训练或评估。 文件详解 文件名称:context_questions_benchmark.json 文件格式:JSON...
    packageimg
  • 有限状态自动机用户_智能体交互语料库_NoVAGraphS_FSA

    2025年12月25日   

    数据集概述 本数据集为围绕有限状态自动机(FSA)描述的用户-智能体交互语料库,包含结构化交互数据、FSA图形与状态表文件及RASA配置文件,用于支持对话系统研究,尤其关注视障用户的交互需求。 文件详解 核心交互数据文件: 未命名CSV文件:...
    packageimg
  • Touché22比较问题的论点检索数据集

    2025年12月22日   

    数据集概述 该数据集为2022年Touché会议“比较问题的论点检索”任务的专用数据,包含问题主题、检索段落、评估结果等文件,覆盖相关性、立场、质量三类评估维度,支持论点检索算法的开发与评测。 文件详解 该数据集包含15个文件,按类型分为以下几类: - 问题与段落数据文件: - topics-...
    packageimg
  • DBLP_QuAD学术知识图谱问答数据集

    2025年12月21日   

    数据集概述 该数据集基于DBLP学术知识图谱构建,包含一万条问答对及对应的SPARQL查询语句,可用于在DBLP知识图谱上执行查询获取正确答案,是首个面向学术知识图谱的问答数据集。 文件详解 文件名称:DBLP-QuAD.zip 文件格式:ZIP压缩包...
    packageimg
  • 五尾多轮视觉推理数据集

    2025年12月20日   

    数据集概述 该数据集围绕五尾多轮视觉推理(5T‑MVR)构建,包含评估五种提示条件(BASELINE、OBSERVE、ANALYZE、EVALUATE、INTERPRET)在五轮图像刺激对话中的脚本、样本数据、结果文件及说明文档,支持通过OpenAI API生成日志、分析对话轮次并生成可视化结果。 文件详解...
    packageimg
  • SQA3D_3D场景情境化问答数据集

    2025年12月19日   

    数据集概述 该数据集围绕3D场景情境化问答任务构建,基于ScanNet的650个场景,包含6.8千个独特情境、20.4千条情境描述及33.4千个推理问题,覆盖空间关系、常识理解等能力,用于评估智能体的3D场景理解与推理性能。 文件详解 文件名称: answer_counter.json:JSON格式文件,可能用于统计或记录问答相关的计数信息。...
    packageimg
  • SciQA基准数据集及RDF转储数据

    2025年12月19日   

    数据集概述 本数据集包含SciQA基准的问题与查询数据,分为人工构建(一百条)和自动生成(两千四百六十五条)两类问题。提供JSON格式的问题/查询文件及RDF NTriples格式的转储文件,支持导入RDF引擎进行查询分析。 文件详解 该数据集包含两个压缩文件,具体说明如下: - 文件名称: SciQA-...
    packageimg
  • 东京都立大学在线学习系统日语FAQ数据集

    2025年12月13日   

    数据集概述 该数据集包含东京都立大学在线学习系统的FAQ数据及其分类,用于训练专用聊天机器人。数据基于2015年4月至2018年7月师生使用系统时的真实问答记录,提供日语原版及英文翻译版数据,支持学术研究。 文件详解 该数据集包含两类文件,具体说明如下: - FAQ数据文件(CSV格式): - Answer2Category.csv:答案分类对应关系...
    packageimg
  • 糖尿病黄斑水肿视觉问答数据集

    2025年12月11日   

    数据集概述 该数据集是基于IDRiD和eOphta数据集构建的医学视觉问答(VQA)数据集,包含健康与病变眼底图像,针对每张图像生成预定义问题,部分区域相关问题附带位置掩码,可用于研究VQA模型的一致性。 文件详解 文件名称: dme_vqa.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 语义相关性句子对数据集2023

    2025年12月9日   

    数据集概述 该数据集包含五千五百个英文句子对,每个句子对依据语义相关程度被赋予零到一的评分,零代表最不相关,一代表最相关。数据通过最佳最差标度法(Best-Worst Scaling)收集,旨在支持句子语义相关性、句子表示方法及相关应用的研究。 文件详解 核心数据文件: sem_text_rel_ranked.csv:...
    packageimg
  • Mistral_Small_3_1模型系统评估问答数据集

    2025年12月9日   

    数据集概述 该数据集包含用于大型语言模型(LLM)知识系统评估的德语开放式和选择题问答数据,记录了Mistral Small 3.1模型的回答结果,支持LLM知识能力的评估分析。 文件详解 文件名称: C_1.0.pdf,文件格式: PDF,内容为德语问答相关的文档 文件名称: C_2.0.pdf,文件格式: PDF,内容为德语问答相关的文档...
    packageimg