云聪古籍数字化平台:功能介绍

一、平台介绍

云聪古籍数字化平台,功能涵盖古籍OCR识别、民国报纸OCR识别、族谱县志OCR识别、图文逐字校对、数据著录、智能标点分段、精编排版、智能白话译文、知识图谱等,是一站式线上整理全流程平台。平台集成了团队管理功能,可支持大规模校编团队协同工作。


云聪OCR识别能力处于国内一线水平,支持8.7万个繁简汉字的OCR识别,涵盖大部分异体字,并且对手写字体也有很好的识别精度。在历次古籍OCR技术评测中,云聪的识别准确率均位居前列,尤其对明清刻本、抄本、稿本等常见古籍类型的识别效果,获得了多家图书馆和出版社的认可。

另外, 云聪OCR  对蒙古语、藏语、维吾尔语、朝鲜语、哈萨克语等少数民族语言也有较好的支持,识别率在95%以上。云聪智能依托哈工程博士团队在人工智能方面的积累和人才优势,深耕文化服务行业,用AI赋能文化创新,已经先后为国内30余家图书馆、文化馆、档案馆等文化机构提供人工智能服务,直接或间接客户遍布于17个省份。

云聪古籍数字化平台,已经为上海中医药大学、南京中医药大学、成都中医药大学、广西中医药大学、河南中医药大学、华南师范大学、上海师范大学、南京师范大学、西南民族大学、内蒙古大学、广西科技大学、贵州师范大学、江西科技师范大学等80多所高校的师生提供服务,累计资助古籍数字化相关研究课题20余项,完成古籍识别超40万叶,涵盖经史子集、中医典籍、地方志、族谱家乘、民国报刊等多种类型。平台始终秉持公益性、低成本原则,确保每位用户都能以合理的价格享受到高质量的数字化服务。


平台拥有校编团队30余人,并集成了团队管理功能,可以组织大规模校编团队进行古籍、报纸校编任务的分派、审核等工作。平台依托人工智能,低成本降本增效,推动古籍整理工作进程。


本平台可按照《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》最新要求导出双层PDF、XML元数据、成果文件等等。


平台自研,支持本地私有化部署,可满足各图书馆、档案馆保密要求。


二、登录与试用

本平台以公益性为原则,在人工智能算力充足的基础上,欢迎个人用户(学生、教师)以学习中华传统文化为目的,有限免费使用。

企业会员请联系微信 ocr2025 开通试用。

浏览器推荐:谷歌浏览器。

三、科研常用功能

1、阅读与划词查询

平台新版阅读视图支持原文与AI译文逐行对照,选中任意文字即可查询释义。对于中医经典文献、国学典籍中的疑难字词,划词即可查看同音字、形似字、释义说明,大幅减少科研人员查字典的时间。

2、AI翻译

文言文一键翻译为白话文,支持整页翻译与划段翻译,译文与原文逐行对照。对于中医古籍中的难懂段落,AI翻译可以帮助快速理解大意,提高阅读效率。翻译结果中的关键术语配有注解词,鼠标悬停即可查看专业释义。

3、成果导出

研究成果需要存档、发表、共享,平台支持多种导出格式,满足不同需求:

  • 双层PDF — 可搜索、可复制,符合《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》标准,直接可用于成果提交
  • TXT / DOCX — 纯文本或富文本,方便二次整理、引用和排版
  • XML — 含完整元数据,可与图书馆数字系统对接,支持《古籍数字化和知识标引规范手册》格式

导出支持选择范围(当前页或全书)、繁简体选择,按需灵活导出。

5、繁简转换

繁体简体一键双向转换,满足不同研究者的阅读和引用习惯。转换后保留原文排版,不改变文字内容和结构。

6、划词复制与识别

在古籍图像上框选任意区域,即可复制该区域的OCR识别文字,或对选定区域重新进行OCR识别。对于图像中个别识别错误的区块,无需整页重识,精准修复。

四、加工流程

云聪古籍数字化平台加工流程包括 批量上传、任务分派、逐字校对、数据著录、精编排版、数据导出 六大流程,针对不同的常见场景可以灵活调整整理流程。


1、批量上传

2、任务分派


3、逐字 & 集字校对

4、数据著录

五、加工成本

受图像质量、版面布局、文字类型、字体风格等因素影响,不同古籍、报纸的加工成本并不相同,均可依据实际情况商榷,能达到双赢才是最好的结果。比如图像质量差、人工校对的成本就高。

受益于本平台人工智能算法优先性,其成本远低于同行费用。

排除人工校对费用,本平台古籍半筒子页(A或B单面)在0.4~0.7元左右,繁体中文报纸单页40元左右,简体中文报纸单页20元左右。

另外,平台支持全链路OEM以及私有化部署。

类型OCR / 半筒子页校对 / 半筒子页AI翻译导出PDF
古籍(稿本、刻本、抄本等)0.3~1.2元平台免费0.02元/页0.02元/页
繁体中文报纸(民国近代)20~50元平台免费0.02元/页0.02元/页
简体中文报纸(70年代以后)10~30元平台免费0.02元/页0.02元/页

对于资金有限的大学老师和学生,请联系微信 ocr2025,平台将全力支持学术研究用途。

六、联系我们

如您在功能使用中有任何意见或建议,欢迎您通过以下方式给予我们反馈,您的提议将有助于我们不断完善。

1)合作咨询 手机号 133-5688-3552(微信号 ocr2025)

2)校编团队咨询 手机号 17669729155(微信同号)

3)扫码添加云聪微信号,直接反馈


客服二维码