作者:刘力算力魔方创始人/英特尔创新大使
《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》收到了读者热烈反响c,很多读者提出:如何在C#中部署飞桨PP-OCRv4模型?本文从零开始详细介绍整个过程。
1什么是PP-OCRv4模型?
PP-OCRv4是PaddleOCR工具库的PP-OCR系列模型中,当前性能最优的一个。它在前代模型(PP-OCRv3)的基础上,针对检测模型和识别模型进行了数据、网络结构、训练策略等多个模块的优化,在多个应用场景中,精度均有大幅提升:
·中文场景,相对于PP-OCRv3中文模型提升超4%;
·英文数字场景,相比于PP-OCRv3英文模型提升6%;
·多语言场景(支持韩语、日语、德语、法语等80种语言),平均准确率提升超8%。
PP-OCRv4是一个两阶段的OCR系统,包含检测模型、方向分类模型和识别模型。在检测和识别之间添加方向分类模型,将不同角度的文本检测框修正为水平检测框,方便识别模型完成行文本识别。
为了适应服务器和边缘端不同场景的部署需求,PP-OCRv4提供两种推理模型权重版本:
边缘端:中英文超轻量PP-OCRv4模型(16.1M) = 检测模型(4.7M) 识别模型(10.0M) 方向分类模型(1.4M)。Hmean:62.24%;ACC:70.1%。
服务器端:中英文高精度PP-OCRv4 server模型(199.4M) = 检测模型(110M) 识别模型(88M) 方向分类模型(1.4M)。Hmean:82.69%;ACC:84.04%。
PP-OCRv4模型详述链接:
https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/ppocr/blog/PP-OCRv4_introduction.mdsudo sh -c 'echo "deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main" > /etc/apt/sources.list.d/ros-latest.list'
PP-OCRv4模型的卓越性能使其在多个领域具有广泛的应用前景,如文档扫描、文字提取、智能表单填写、物流信息追踪、文档自动化处理、智能服务窗口、文献资料整理等等。本文将介绍使用OpenVINO工具套件在英特尔 CPU、独立显卡、集成显卡和NPU上优化并部署飞桨PP-OCRv4模型。
PP-OCRv4模型在飞桨AIStudio星河社区范例项目:
https://aistudio.baidu.com/projectdetail/8770259
2OpenVINO C# API简介
OpenVINO C# API是一个开源的 OpenVINO 的 .Net wrapper(包装器)项目,它基于最新的OpenVINO Runtime库开发,通过调用官方的OpenVINO C API ,允许开发者在 .NET 和 .NET Framework 环境中使用 C# 语言调用AI模型,并实现AI模型在英特尔 CPU、独立显卡、集成显卡、NPU上的推理加速。
OpenVINO C# API的GitHub仓:https://github.com/guojin-yan/OpenVINO-CSharp-API
3搭建开发环境
请参考《C# 中使用OpenVINO:轻松集成AI模型!》完成OpenVINO C# API开发环境搭建。然后,启动“命令提示符”,用命令创建“ppocrv4_csharp”推理项目:
dotnet new console -o ppocrv4_csharp -f net8.0
然后,进入“ppocrv4_csharp”目录,使用NuGet安装OpenVINO C# API,命令如下:
dotnet add package OpenVINO.CSharp.API dotnet add package OpenVINO.runtime.win dotnet add package OpenVINO.CSharp.API.Extensions.OpenCvSharp dotnet add package OpenVINO.CSharp.API.Extensions.PaddleOCR
最后,安装OpenCvSharp 4.9.0版:
dotnet add package OpenCvSharp4 --version 4.9.0.20240103 dotnet add package OpenCvSharp4.runtime.win --version 4.9.0.20240103
完成PP-OCRv4的OpenVINO C# API开发环境安装。
4编写C# PP-OCRv4推理程序
PP-OCRv4的范例程序已开源,请将代码仓克隆到本地:
git clone https://github.com/guojin-yan/PaddleOCR-OpenVINO-CSharp.git
接着,将“在线模型识别”范例代码拷贝到Program.cs中,如下所示:
最后,在VS Code中运行该代码,结果如下所示:
5总结
使用OpenVINO C# API可以直接读入PP-OCRv4模型(无需转换),并能方便快捷的将PP-OCRv4模型用C#代码部署在英特尔 CPU、独立显卡、集成显卡、NPU等硬件上。
关注
61文章
10028浏览量
172503免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com