数学竞赛问题集-SigmaDolphin数据集筛选与清洗-AIME与AMC场景-2013至今

数学竞赛问题集-SigmaDolphin数据集筛选与清洗-AIME与AMC场景-2013至今 数据来源:互联网公开数据 标签:数学,问题求解,自然语言处理,人工智能,AIME,AMC,竞赛,文本数据,筛选,清洗 数据概述: 本数据集是对Sigma Dolphin数据集的清洗与筛选版本,旨在为利用人工智能技术解决数学文字题提供支持。原始数据集由微软亚洲研究院创建,收录了来自网络社区(如Yahoo! Answers)的各种数学文字题。本数据集重点关注与美国数学邀请赛(AIME)和美国数学竞赛12年级组(AMC 12)相关的题目。数据经过TF-IDF向量化和K-means聚类处理,生成了多个版本,分别基于不同的相似度阈值进行筛选。

数据用途概述: 该数据集主要用于人工智能模型的训练和评估,特别是针对数学文字题的自然语言处理和问题求解任务。研究人员和开发者可以利用本数据集构建和优化能够解决AIME和AMC类型问题的AI系统。此外,数据集也适用于教育领域,为学生提供练习题库,帮助其提升数学解题能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。