PP-OCRv6正式发布，精度全面跃升

发布日期：2026/6/18 23:49:16 浏览量：

百度飞桨 PaddleOCR 团队正式开源 PP-OCRv6,PP-OCR 系列第六代文本检测识别模型。本次首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖浏览器端、嵌入式设备到服务器的全算力平台。相比 PP-OCRv5 同级别模型,文字检测精度提升 4.9%、识别精度提升 5.1%;其中 Medium 档在 Intel Xeon CPU 上端到端时延 1.40s,达到 PP-OCRv5_Server 的 5.2 倍速度,Tiny 档在浏览器端单图最低仅 97ms。单模型支持语言从 4 种扩展到 50 种,并新增电路板、数码管、CAD 图纸、喷码点阵字符等工业场景。

开源地址：
PaddleOCR官网：https://paddleocr.com
Github：https://github.com/PaddlePaddle/PaddleOCR
ModelScope：https://modelscope.cn/collectio

01 PP-OCRv6特性速览
1. 首次三档模型，全算力覆盖：PP-OCR系列首次推出三档模型：Tiny（1.5M）、small（7.7M）、medium（34.5M）。从浏览器端、嵌入式设备到服务器，三档模型覆盖几乎所有主流算力平台，按需选择，开箱即用。

*2. 精度跨越式提升：*文字检测精度较PP-OCRv5同级别模型提升4.9%，文字识别精度较PP-OCRv5同级别模型提升5.1%。不是微调级别的涨点，而是跨越式的代际提升。

*3. CPU推理速度显著提升：*在同级别模型中，PP-OCRv6_medium的端到端时延仅为1.40s（基于 Intel Xeon 与 OpenVINO 优化），推理速度达到了前代PP-OCRv5_Server的5.2倍！而超轻量级的tiny档表现更为炸裂，在纯前端浏览器环境的极低算力下，直接轰出了单图97ms的惊人成绩！

*4. 场景覆盖大幅扩展：*单模型支持50种语言，远超PP-OCRv5单模型的4种语言。此外，新增电路板、数码管、CAD图纸、喷码点阵字符等多种工业场景的文字检测与识别，真实复杂场景适用性大幅增强。

*5. 鲁棒性史上最高：*在文字检测多尺寸预测上，预测一致性方差仅5.19%，较PP-OCRv5降低35%；在文字识别边缘尺寸扰动评估集上，预测一致性较PP-OCRv5提升20.5%。

02 效果预览
1.文本检测（与PP-OCRv5和部分大模型的对比）

03 快速开始
安装飞桨框架与 PaddleOCR（3.7.0 及以上版本）：

python -m pip install paddlepaddle==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
python -m pip install "paddleocr>=3.7.0"
在命令行快速体验 PP-OCRv6 能力（3.7.0 及以上版本的默认PP-OCR模型已切换到v6版本）：

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--use_textline_orientation False
也可以调用 Python API，将 PP-OCRv6 能力集成到下游应用中：

from paddleocr import PaddleOCR

ocr = PaddleOCR(
use_doc_orientation_classify=False,
use_doc_unwarping=False,
use_textline_orientation=False,
)
# 指定模型档位
# ocr = PaddleOCR(
# text_detection_model_name="PP-OCRv6_tiny_det",
# text_recognition_model_name="PP-OCRv6_tiny_rec",
# use_doc_orientation_classify=False,
# use_doc_unwarping=False,
# use_textline_orientation=False,
# )

result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png")
for res in result:
res.print()
res.save_to_img("output")
res.save_to_json("output")

此外，在 v3.7版本中，模型的推理已经广泛兼容 onnxruntime、transformers后端，你可以根据你的当前实际环境，通过指定engine来指定特定的推理后端。如使用onnxruntime来推理，只需要增加engine参数，并指定为”onnxruntime”即可。如：

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
--use_doc_orientation_classify False \
--use_doc_unwarping False \
--use_textline_orientation False \
--engine onnxruntime

业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询： 如果您有业务方面的问题或者需求，欢迎您咨询！我们带来的不仅仅是技术，还有行业经验积累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 联系人：石先生/雷先生