0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA与飞桨共同深度适配的NGC飞桨容器在NVIDIA GPU上体验

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-01 10:41 次阅读

PaddleOCR 发版 v2.6,带来全新升级的 PP-StructureV2 智能文档分析系统,实现一键 PDF 转 Word。欢迎广大开发者使用 NVIDIA 与飞桨共同深度适配的 NGC 飞桨容器在 NVIDIA GPU 上体验!

1. PaddleOCR v2.6 版本升级

随着企业数字化进程不断加速,PDF 转 Word 的功能、纸质文本的电子化存储、文件复原与二次编辑、信息检索等应用都有着强烈的企业需求。目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还存在额度限制。此外,最终转换效果也依赖于版面形态,无法做到针对性适配。

针对开发者的需求,飞桨文字识别套件 PaddleOCR 全新发布 PP-StructureV2 智能文档分析系统,支持一行命令实现 PDF 转 Word 功能,文字、表格、标题、图片都可完整恢复,一键实现 PDF 编辑自由!

db0f69ac-5934-11ed-a3b6-dac502259ad0.png

文档分析示例

PP-StructureV2 智能文档分析系统升级点包括以下 2 方面:

系统功能升级:新增图像矫正和版面复原模块,支持标准格式 PDF 和图片格式 PDF 解析!

系统性能优化:

版面分析:发布轻量级版面分析模型,速度提升 11 倍,平均 CPU 耗时仅需 41ms!

表格识别:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%。

关键信息抽取:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升超过 9.1%。

GitHub 传送门:

https://github.com/PaddlePaddle/PaddleOCR

1.1 PP-StructureV2 智能文档分析系统优化策略概述

PP-StructureV2 系统流程图如下所示,文档图像首先经过图像矫正模块,判断整图方向并完成转正,随后可以完成版面信息分析与关键信息抽取 2 类任务。

db3ed746-5934-11ed-a3b6-dac502259ad0.png

在版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入 OCR 引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的 Word 或者 PDF 格式的文件。

在关键信息抽取任务中,首先使用 OCR 引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。

算法改进思路来看,对系统中的 3 个关键子模块,共进行了 8 个方面的改进:

版面分析

PP-PicoDet:轻量级版面分析模型

FGD:兼顾全局与局部特征的模型蒸馏算法

表格识别

PP-LCNet: CPU 友好型轻量级骨干网络

CSP-PAN:轻量级高低层特征融合模块

SLAHead:结构与位置信息对齐的特征解码模块

关键信息抽取

VI-LayoutXLM:视觉特征无关的多模态预训练模型结构

TB-YX:考虑阅读顺序的文本行排序逻辑

UDML:联合互学习知识蒸馏策略

最终,与 PP-StructureV1 相比:

版面分析模型参数量减少 95%,推理速度提升 11 倍,精度提升 0.4%;

表格识别预测耗时不变,模型精度提升 6%,端到端 TEDS 提升 2%;

关键信息抽取模型速度提升 2.8 倍,语义实体识别模型精度提升 2.8%;关系抽取模型精度提升 9.1%。

PP-StructureV2 优化详细策略解析三日课回放,可以扫描下方二维码,加入 PaddleOCR 官方交流群获取。除此之外,入群福利还包括:社区开发者基于 PP-StructureV2 开发的 PDF2Word 应用程序、《动手学 OCR》电子书、10 个 OCR 场景应用垂类模型等。

PP-StructureV2 技术报告:

https://arxiv.org/abs/2210.05391v2

2. NGC 飞桨容器介绍

如果您希望体验 PaddleOCRv2.6 的新特性,欢迎使用 NGC 飞桨容器。NVIDIA 与百度飞桨共同开发了 NGC 飞桨容器,将最新版本的飞桨与最新的 NVIDIA 的软件栈(如 CUDA)进行了无缝的集成与性能优化,最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

最佳的开发环境搭建工具 - 容器技术。

容器其实是一个开箱即用的服务器。极大降低了深度学习开发环境的搭建难度。例如你的开发环境中包含其他依赖进程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要进行跨操作系统级别的迁移。

容器镜像方便了开发者的版本化管理

容器镜像是一种易于复现的开发环境载体

容器技术支持多容器同时运行

最好的 PaddlePaddle 容器

NGC 飞桨容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化 NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (DALI, RAPIDS)、训练(cuDNN, NCCL)和推理 (TensorRT)工作负载的软件。

PaddlePaddle 容器具有以下优点:

适配最新版本的 NVIDIA 软件栈(例如最新版本 CUDA),更多功能,更高性能。

更新的 Ubuntu 操作系统,更好的软件兼容性

按月更新

满足 NVIDIA NGC 开发及验证规范,质量管理

通过飞桨官网快速获取

环境准备

使用 NGC 飞桨容器需要主机系统(Linux)安装以下内容:

Docker 引擎

NVIDIA GPU 驱动程序

NVIDIA 容器工具包

有关支持的版本,请参阅 NVIDIA 框架容器支持矩阵和 NVIDIA 容器工具包文档。

不需要其他安装、编译或依赖管理。无需安装 NVIDIA CUDA Toolkit。

3. 飞桨与 NVIDIA NGC 合作介绍

目前飞桨已拥有超过 470 万的开发者。而在过去五年,飞桨与 NVIDIA 团队紧密合作,双方深度融合,做了大量适配工作。

今年,NVIDIA 在国内也已经设立了专门的工程团队支持,赋能飞桨生态。

而为了让更多的开发者能用上基于 NVIDIA 最新的高性能硬件和软件栈。当前,NVIDIA 团队正在进行全新一代 GPU 的适配工作,以及提高飞桨对 CUDA Operation API 的使用率,让飞桨的开发者拥有优秀的用户体验及极致性能。

以上的各种适配,仅仅是让飞桨的开发者拥有高性能的推理训练成为可能。但是,这些离行业开发者还很远,门槛还很高,难度还很大。

为此,我们将刚刚这些集成和优化工作,整合到三大产品线中。其中 NGC 飞桨容器最为闪亮。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4986

    浏览量

    103039
  • 存储
    +关注

    关注

    13

    文章

    4314

    浏览量

    85839
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4739

    浏览量

    128940
  • 飞桨
    +关注

    关注

    0

    文章

    33

    浏览量

    2286

原文标题:在 NVIDIA NGC 上体验一键 PDF 转 Word

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25

    Ubuntu 24.04 LTS上安装PaddleX

    前面我们介绍了《Windows用远程桌面访问Ubuntu 24.04.1 LTS》本文接着介绍安装PaddleX。 PaddleX 3.0  是基于飞框架构建的一站式全流程开发
    的头像 发表于 11-11 17:45 246次阅读
    <b class='flag-5'>在</b>Ubuntu 24.04 LTS上安装<b class='flag-5'>飞</b><b class='flag-5'>桨</b>PaddleX

    凌智电子加入技术伙伴计划,携手PaddleX为视觉模组产品赋能添“智”

    近日,福州市凌睿智捷电子有限公司(以下简称凌智电子)正式加入技术伙伴计划。双方将共同探索人工智能技术边缘端部署中的创新与应用。凌智电子将凭借其
    的头像 发表于 11-01 08:07 273次阅读
    凌智电子加入<b class='flag-5'>飞</b><b class='flag-5'>桨</b>技术伙伴计划,携手PaddleX为视觉模组产品赋能添“智”

    AMD与NVIDIA GPU优缺点

    图形处理单元(GPU)市场,AMD和NVIDIA是两大主要的竞争者,它们各自推出的产品性能、功耗、价格等方面都有着不同的特点和优势。 一、性能
    的头像 发表于 10-27 11:15 690次阅读

    NVIDIA Modulus助力风阻预测模型实现

    NVIDIA 与百度双方技术团队通过在数据、算法、模型等多个方面的合作,共同打造了一款适用于车辆空气动力学数值模拟的 3D 高精度汽车风阻预测模型——DNNFluid-Car。经过
    的头像 发表于 08-23 17:10 890次阅读

    暴涨预警!NVIDIA GPU供应大跳水

    gpu
    jf_02331860
    发布于 :2024年07月26日 09:41:42

    NVIDIA与百度携手革新汽车风阻预测:DNNFluid-Car模型的崛起

    追求更高效、更环保的汽车设计浪潮中,NVIDIA与百度携手突破传统界限,共同研发了一款革命性的3D高精度汽车风阻预测模型——DNNFl
    的头像 发表于 07-09 14:56 1604次阅读

    百度发布文心大模型4.0 Turbo与框架3.0,引领AI技术新篇章

    SUMMIT深度学习开发者大会2024上,向世界展示了百度AI领域的最新成果——文心大模型4.0 Turbo和框架3.0,并详细披露了
    的头像 发表于 06-29 16:03 636次阅读

    NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

    美敦力、SETI 协会以及领先制造商正在构建 NVIDIA IGX 系统,为 AI 工业边缘赋能。   NVIDIA 于6月2日宣布,集成NVIDIA Holoscan的
    的头像 发表于 06-04 10:21 505次阅读

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 623次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于
    的头像 发表于 04-20 09:39 725次阅读

    FPGA深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    深度解读Nvidia AI芯片路线图

    Nvidia是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C技术将CPU、GPU进行灵活连接组合形成统一
    发表于 03-13 09:25 947次阅读
    <b class='flag-5'>深度</b>解读<b class='flag-5'>Nvidia</b> AI芯片路线图

    NVIDIA的Maxwell GPU架构功耗不可思议

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架构,它有着极高的能效,出场方式也非常特别。
    的头像 发表于 02-19 16:39 1025次阅读
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b>架构功耗不可思议

    如何选择NVIDIA GPU和虚拟化软件的组合方案呢?

    NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站,加速图形和计算,使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。
    的头像 发表于 01-12 09:26 1124次阅读
    如何选择<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虚拟化软件的组合方案呢?