高校招生问答数据集

数据收集过程始于对选定的高等教育机构的网站进行网络抓取,收集 2023 年 7 月至 9 月期间与高等教育机构招生主题相关的任何数据。这产生了一个主要围绕招生相关内容的原始数据集。随后,实施了细致的数据清理和组织程序来完善数据集。在注释为问答格式之前,原始数据的原始形式主要是印尼语。此后,进行了全面的注释过程,以丰富数据集中特定的招生相关信息,将其转换为次要数据。主要数据和次要数据主要仍为印尼语。为了提高数据质量,我们添加了过滤器以删除或排除:1) 非印尼语数据、2) 与招生主题无关的数据和 3) 冗余条目。这种细致的整理最终创建了一个最终数据集,经过精心准备,现在可以随时用于高等教育招生领域的研究和分析。

packageimg

数据与资源

附加信息

字段
数据集大小 0.34 MiB
最后更新 2025年2月8日
创建于 2024年11月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。