微立顶科技

新闻资讯

创新 服务 价值

  PP-OCRv6正式发布,精度全面跃升

发布日期:2026/6/18 23:49:16      浏览量:

百度飞桨 PaddleOCR 团队正式开源 PP-OCRv6,PP-OCR 系列第六代文本检测识别模型。本次首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖浏览器端、嵌入式设备到服务器的全算力平台。相比 PP-OCRv5 同级别模型,文字检测精度提升 4.9%、识别精度提升 5.1%;其中 Medium 档在 Intel Xeon CPU 上端到端时延 1.40s,达到 PP-OCRv5_Server 的 5.2 倍速度,Tiny 档在浏览器端单图最低仅 97ms。单模型支持语言从 4 种扩展到 50 种,并新增电路板、数码管、CAD 图纸、喷码点阵字符等工业场景。


开源地址:
PaddleOCR官网:https://paddleocr.com
Github:https://github.com/PaddlePaddle/PaddleOCR
ModelScope:https://modelscope.cn/collectio

01 PP-OCRv6特性速览
1. 首次三档模型,全算力覆盖:PP-OCR系列首次推出三档模型:Tiny(1.5M)、small(7.7M)、medium(34.5M)。从浏览器端、嵌入式设备到服务器,三档模型覆盖几乎所有主流算力平台,按需选择,开箱即用。

*2. 精度跨越式提升:*文字检测精度较PP-OCRv5同级别模型提升4.9%,文字识别精度较PP-OCRv5同级别模型提升5.1%。不是微调级别的涨点,而是跨越式的代际提升。

*3. CPU推理速度显著提升:*在同级别模型中,PP-OCRv6_medium的端到端时延仅为1.40s(基于 Intel Xeon 与 OpenVINO 优化),推理速度达到了前代PP-OCRv5_Server的5.2倍!而超轻量级的tiny档表现更为炸裂,在纯前端浏览器环境的极低算力下,直接轰出了单图97ms的惊人成绩!

*4. 场景覆盖大幅扩展:*单模型支持50种语言,远超PP-OCRv5单模型的4种语言。此外,新增电路板、数码管、CAD图纸、喷码点阵字符等多种工业场景的文字检测与识别,真实复杂场景适用性大幅增强。

*5. 鲁棒性史上最高:*在文字检测多尺寸预测上,预测一致性方差仅5.19%,较PP-OCRv5降低35%;在文字识别边缘尺寸扰动评估集上,预测一致性较PP-OCRv5提升20.5%。

02 效果预览
1.文本检测(与PP-OCRv5和部分大模型的对比)

03 快速开始
安装飞桨框架与 PaddleOCR(3.7.0 及以上版本):

python -m pip install paddlepaddle==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
python -m pip install "paddleocr>=3.7.0"
在命令行快速体验 PP-OCRv6 能力(3.7.0 及以上版本的默认PP-OCR模型已切换到v6版本):

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False
也可以调用 Python API,将 PP-OCRv6 能力集成到下游应用中:

from paddleocr import PaddleOCR

ocr = PaddleOCR(
    use_doc_orientation_classify=False,
    use_doc_unwarping=False,
    use_textline_orientation=False,
)
# 指定模型档位
# ocr = PaddleOCR(
#     text_detection_model_name="PP-OCRv6_tiny_det",
#     text_recognition_model_name="PP-OCRv6_tiny_rec",
#     use_doc_orientation_classify=False,
#     use_doc_unwarping=False,
#     use_textline_orientation=False,
# )

result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png")
for res in result:
    res.print()
    res.save_to_img("output")
    res.save_to_json("output")


此外,在 v3.7版本中,模型的推理已经广泛兼容 onnxruntime、transformers后端,你可以根据你的当前实际环境,通过指定engine来指定特定的推理后端。如使用onnxruntime来推理,只需要增加engine参数,并指定为”onnxruntime”即可。如:

paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False \
    --engine onnxruntime



  业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     联系人:石先生/雷先生