韩国科研项目摘要分类数据集KoreanResearchProjectAbstractClassification-geniekorea

韩国科研项目摘要分类数据集KoreanResearchProjectAbstractClassification-geniekorea

数据来源:互联网公开数据

标签:科研项目, 文本分类, 韩国, 能源, 机器学习, 自然语言处理, 多分类, 研究摘要

数据概述: 该数据集包含来自韩国科研项目的摘要信息,用于科研项目摘要的分类任务。主要特征如下: 时间跨度:数据集未明确标明时间范围,但根据“제출년도”(提交年份)字段推测,数据涵盖一定年份的科研项目。 地理范围:数据主要来源于韩国的科研项目。 数据维度:数据集包含多个字段,包括项目索引(index)、提交年份(제출년도)、项目名称(사업명)、所属部门(사업_부처명)、是否为持续项目(계속과제여부)、子项目名称(내역사업명)、项目标题(과제명)、研究目标摘要(요약문_연구목표)、研究内容摘要(요약문_연구내용)、预期成果摘要(요약문_기대효과)、韩语关键词(요약문_한글키워드)、英语关键词(요약문_영문키워드)以及分类标签(label)。labels_mapping.csv文件提供了标签与“소분류”(小分类)的对应关系。 数据格式:数据集以CSV格式提供,包含train.csv(训练集)、test.csv(测试集)、sample_submission.csv(提交样例)和labels_mapping.csv(标签映射)四个文件。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于自然语言处理、机器学习等领域的学术研究,例如文本分类、摘要生成、关键词提取等。 行业应用:可用于科研项目管理、知识发现、信息检索等领域,帮助科研机构和政府部门更好地组织和分析科研项目。 决策支持:支持科研项目资助决策、项目评估等,帮助决策者更好地了解科研项目的分布和发展趋势。 教育和培训:作为自然语言处理、机器学习等课程的实训数据,帮助学生和研究人员熟悉文本分类任务,并了解韩国科研项目的特点。 此数据集特别适合用于探索韩国科研项目的分类模式,以及构建基于文本的科研项目推荐系统,从而提升科研效率和决策质量。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 279.62 MiB
最后更新 2025年5月29日
创建于 2025年5月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。