保加利亚19500本书籍注释数据集1960-2021
数据来源:互联网公开数据
标签:书籍分类,保加利亚,书籍信息,数据清理,文本分析,出版信息,图书管理
数据概述:
本数据集包含了从biblioman.info数据库获取的19500本书籍的详细信息,数据集共有104个字段,涵盖了书籍的广泛信息,包括书籍的基本信息、出版信息、作者信息、翻译信息等。该数据集主要用于书籍分类项目,目标变量为category_id。
数据用途概述:
该数据集适用于书籍分类、出版分析、作者研究、翻译趋势分析等多种场景。研究人员可以利用此数据进行书籍分类模型的训练和评估,了解保加利亚书籍出版业的发展趋势;出版商可以借助数据优化出版策略;翻译机构可基于数据识别潜在的翻译机会。
举例:
数据集中每个书籍记录包括以下关键信息:id(书籍唯一标识符)、updated_at(最后更新时间)、created_at(创建时间)、cover(封面文件名)、back_cover(封底文件名)、title(书名)、author(作者)、annotation(注释)、notes_about_original(原始语言书名和作者)、price(价格)、translator(翻译者)、isbn(国际标准书号)、isbn_clean(清理后的isbn)、universal_decimal_classification(国际十进分类法)、editor(编辑)、publisher(出版社)、printing_house(印刷厂)、corrector(校对员)、page_count(页数)、genre(体裁)、publishing_year(出版年份)、printer_sheets(印刷张数)、format(格式)、artist(封面设计师)、publisher_address(出版社地址)、category_id(类别ID)、date_of_translation(翻译日期)、nationality(国籍)、translated_from_language(翻译原语言)、content_type(内容类型)、nb_scans(扫描次数)、created_by_user_id(创建用户ID)、created_by(创建者)。这些字段提供了丰富的信息,有助于深入分析保加利亚书籍市场的发展。