古籍数字化不只是把文字识别出来,还需要按照统一标准进行著录——包括元数据、卷目、篇目等信息。云聪古籍平台以2023年12月发布的《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》为重要参考,配合AI辅助填充能力,让著录工作更高效、更规范。
元数据是古籍数字化的基础信息,包括书名、作者、版本、年代、收藏机构等核心字段。平台提供标准化的元数据表单,支持以下著录项:
书籍基本信息:书名、卷数、作者、朝代、版本类型、版本年代、收藏机构、索书号等。
数字化信息:扫描分辨率、色彩模式、图像格式、数字化日期、操作员等。

AI自动填充——平台新增AI辅助填充功能。只需点击"AI填充"按钮,系统会自动从古籍图像和已有数据中提取元数据信息,填入对应字段。大幅减少手动录入工作量,提高著录效率。
篇目(目录)是古籍的结构化索引。平台提供可视化的篇目编辑工具:
篇目列表——以表格形式展示全书篇目,支持添加、删除、拖动排序。
篇目层级——支持多级篇目层级(卷/篇/章/节),通过level字段控制缩进层级。
页面关联——每一条篇目可关联对应的页面,点击篇目即可跳转到该页。
快捷键操作——↑↓键切换篇目、Ctrl+Delete删除、Alt+H替换等,与校对模式一致。

著录完成后,平台支持按照国家标准导出成果文件:
双层PDF——文字层叠加在图像层之上,支持全文搜索和文字复制,符合《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》标准。
XML元数据——含完整的元数据和篇目信息,可与图书馆数字系统对接。
DOCX/TXT——纯文本或富文本格式,方便二次整理和引用。

平台著录功能参考了以下国家标准:
《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(2023年12月)
《GB/T 3792.7—2008 古籍著录规则 》
《WH/T 66-2014 古籍元数据规范 》
《GB/T 21712-2008 古籍修复技术规范与质量要求 》
《WH/T 21-2006 古籍普查规范 》
平台在著录功能开发过程中,优先参考了年代最新、示例最全的《古籍数字化和知识标引规范手册》。如果您的著录要求与现有功能有出入,欢迎联系客服提出意见,我们将持续完善。