数据集概述
本数据集为虚构的12份家庭食谱语料库,是MiniData Project 2025的一部分,用于研究数据管理与开放科学培训。包含结构化食谱数据、分析脚本、可视化图表、食谱扫描件及配套文档,展示开放科学最佳实践。
文件详解
- 结构化数据文件:
- family_recipes.csv:CSV格式,包含食谱ID、名称、食材、食材数量等字段
- family_recipes.json:JSON格式,包含12条食谱记录,字段与CSV一致
- family_recipes.xlsx:Excel格式,原始导出数据
- family_recipes.txt:文本格式,原始表格数据
- 分析脚本文件:
- recipe_analysis.py:Python格式,食材频率分析脚本
- recipe_analysis.R:R格式,食材频率分析脚本
- 可视化与文档文件:
- top_ingredients.png:PNG格式,顶部食材分析图表
- scan_recipe_1.png、scan_recipe_2.png、scan_recipe_3.png:PNG格式,虚构食谱扫描件
- DMP_Project2_FamilyRecipes.pdf:PDF格式,数据管理计划文档
- methodological_note_recipes.pdf:PDF格式,方法学说明文档
- README.md:MD格式,数据集说明文档
- Project2_Dataset_Structure.txt:TXT格式,数据集结构说明
适用场景
- 开放科学实践培训:学习数据集文档撰写、元数据规范及多平台存储方法
- 数据管理教学:演示不同数据类型的许可协议适配(MIT、CC BY等)
- 研究数据整合:实践跨平台(Zenodo、GitHub、HAL)数据关联与OpenAIRE链接
- 数据科学入门:使用虚构食谱数据练习食材频率分析等基础数据处理技能