百度发布新一代文字识别解决方案：PP-OCRv5

2025 年 9 月 13 日

百度发布 OCR 模型 PP-OCRv5，旨在解决通用视觉语言模型在 OCR 领域的局限性。该方案聚焦多场景、多文字类型的文字识别，支持 5 大主流文字类型，升级多种挑战性场景识别能力，较 PP-OCRv4 端到端提升 13 个百分点。采用模块化两阶段流程，模型更小、更高效，适合资源受限硬件，其架构含四个核心组件。模型已在 Hugging Face 上线，用户可在线测试，开发者能下载模型本地部署。

开源中国

百度发布新一代文字识别 AI 模型 PP-OCRv5：仅 0.07B，部分测试超 GPT-4o

IT 之家

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。