0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

联合学习使得跨企业管理复杂的人工智能工作流更加容易

jf_pJlTbmA9 来源:NVIDIA 作者:NVIDIA 2023-07-05 16:30 次阅读

在工作流程中利用人工智能的企业面临的主要挑战之一是管理支持大规模培训和部署机器学习( ML )模型所需的基础设施。为此,NVIDIA FLARE平台提供了一个解决方案:联合学习,使得跨企业管理复杂的人工智能工作流变得更加容易。

NVIDIA FLARE 2.3.0 是 NVIDIA 联合学习平台的最新版本,其中包含了令人兴奋的新功能和增强功能,如:

使用基础设施作为代码的多云支持( IaC

自然语言处理( NLP )示例,包括 BERT 和 GPT-2

用于分离数据和标签的拆分学习

这篇文章详细介绍了这些功能,并探讨了它们如何帮助您的组织提升人工智能工作流程,并通过机器学习获得更好的结果。

多云部署

有了这个版本,您现在可以使用 IaC 无缝管理您的多云基础设施,利用不同云提供商的优势,并分配您的工作负载以提高效率和可靠性。 IaC 使您能够自动化基础设施的管理和部署,从而节省时间并降低人为错误的风险。 NVIDIA FLARE 2.3.0 支持在 Microsoft Azure 和 AWS 云上进行自动部署。

要在云中部署 NVIDIA FLARE,请使用 NVIDIA FLARE CLI 命令创建基础结构、部署和启动 Dashboard UI、FL Server 和 FL Client。要在云中创建和部署 NVIDIA FLARE,请按照NVIDIA FLARE 启动套件,由 NVIDIA FLARE 资源调配过程生成并分发给服务器和客户端的签名软件包。

/start.sh --cloud azure | aws
/start.sh --cloud azure | aws

nvflare dashboard --cloud azure | aws

这些命令将创建资源组、网络、安全、计算运行时实例等(作为代码的基础结构),并将 NVIDIA FLARE 客户端或服务器部署到新创建的虚拟机( VM )。每个启动工具包都包含可独立部署的 FLARE 服务器或客户端的唯一配置。这让用户可以灵活地在 prem 或混合云服务提供商(例如 AWS 上的服务器以及 Azure 和/或 AWS 上的客户端)上进行部署,以实现简单的混合多云配置。

nvidia-flare-one-line-cli-command-multi-cloud-deployment.jpg 图 1 。用于设置多云部署的 NVIDIA FLARE 单行 CLI 命令

LLM 和联合学习

Large language models(LLM)正在开启多个行业的新可能性,比如医疗保健中的药物发现。要了解更多详情,请参见NVIDIA BioNeMo Service 建立生成式 AI 管道以进行药物发现。

在 LLM 培训中利用联合学习有许多好处,包括:

保护数据隐私:模型可以在数据不离开前提的情况下进行训练。即使在同一个组织中,数据位于世界不同地区的不同部门,这一点也可能很重要。例如,考虑到不同的国家隐私法,可能不可能将存储在欧洲和中国的数据复制到一个集中的数据湖中。

避免数据移动:即使不关心隐私,将大量数据从一个位置复制到另一个位置也需要时间和金钱。

利用数据多样性:当不同的站点具有不同类型的数据时,通过联合学习训练模型可以利用这种数据多样性来改进全局模型。

实现任务多样性:具有各种任务的培训模式可以促进‌模型性能。这也可以通过联合学习来实现。

计算成本分布:培训 LLM 需要大量资源,而且成本可能很高。要找到一个拥有足够计算资源的机构来完成这项任务是很有挑战性的。通过联合学习,可以利用来自多个位置的计算资源来训练所有参与者共享的模型。

训练并行性:联合学习通过横向数据拆分和将模型的不同层拆分到不同位置,实现了模型训练的数据和模型并行性。

为了说明这些功能,NVIDIA FLARE 2.3.0 引入了带有 GPT-2(Generative Pretrained transformer 2)和 BERT(Bidirectional Encoder Representations from transformers)模型的 NLP 命名实体识别(NER)示例。要了解更多详情,请访问 GitHub 上的 NVIDIA/NVFlare。参数高效调优和相关工作正在进行中,为未来的版本提供更多 LLM 模型示例。

联邦 NLP

NVIDIA FLARE 能够支持具有不同主干模型的各种 NLP 任务,例如 NER 、文本分类和语言生成。

本次发布的重点是使用 NCBI 疾病数据集进行命名实体识别(NER)应用,该数据集包含生物医学研究论文的摘要,并附有疾病提及,通常用于生物医学领域的 NER 模型的基准测试。更多详情,请参阅NCBI 疾病语料库:疾病名称识别和概念归一化的资源。

NER 的任务包括识别文本中的命名实体,并将其分类到预定义的类别中。在 NCBI 疾病数据集的情况下,目标是识别和捕获疾病提及。

为了解决 NER 任务, NVIDIA FLARE 示例探讨了两种流行型号 BERT 和 GPT-2 的使用。 BERT 是一种基于预训练 transformer 的模型,广泛用于各种 NLP 任务,包括 NER 。 GPT-2 是另一个基于 transformer 的模型,主要用于语言生成,但也可以针对 NER 进行微调。

BERT 基本无上限模型和 GPT-2 模型分别有 1 . 1 亿个和 1 . 24 亿个参数。模型中参数的数量是其大小和复杂性的指示。具有更多参数的较大模型往往会学习数据中更复杂的关系。然而,与较小的模型相比,它们也需要更多的计算资源和更长的训练时间。

即将发布的版本将包括对更大的十亿参数模型和其他任务的支持。

拆分学习

Split learning是一种技术,可以让多方在各自的数据集上协作训练机器学习模型,而无需相互共享原始数据。该模型分为两个或多个部分,每个部分都可以在其中一个参与方上运行。

与传统的 ML 方法相比,这种方法有几个优点,尤其是在数据隐私是主要问题的情况下。与联合学习一样,分离学习从不在各方之间共享原始数据。这意味着敏感信息可以保密,同时使各方能够获得见解并从合作中受益。

NVIDIA FLARE 2.3.0 版本演示了一个分布式学习的示例,其中数据和标签可以分别存放在两个不同的站点上。通过将模型的一部分放在一个站点上,并向另一个站点发送激活/嵌入以计算损失,可以实现数据和模型的保护。您可以在 CIFAR10 分割学习示例 中查看这项技术。

开始使用 NVIDIA FLARE 2 . 3 . 0

NVIDIA FLARE 2.3.0 可以帮助您快速部署到多云环境中,探索 LLM 的 NLP 示例,并展示拆分学习功能。通过将这些功能融入工作流程,可以节省时间、提高准确性、降低风险,从而促进人工智能工作流程的实施。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4935

    浏览量

    102807
  • 人工智能
    +关注

    关注

    1791

    文章

    46845

    浏览量

    237535
收藏 人收藏

    评论

    相关推荐

    基于Notes的OA工作流引擎的设计和实现

    到了更高层次的发展,成为企业管理现代化的重要标志。目前,办公自动化技术越来越普遍地被应用到***机关、金融机构和企事业单位的日常管理中,成为提高工作效率、优化管理流程的重要手段。
    发表于 04-24 09:22

    人工智能--失业将是人类面临的最大挑战

    并不完全同意这些观点,他认为,人工智能是人类生活过程中工作流程不断自动化的一个延续。  一场AlphaGo的人机围棋大战似乎让全世界进入了人工智能的元年。很多人在讨论甚至担忧:我们人类
    发表于 06-27 11:06

    百度人工智能大神离职,人工智能的出路在哪?

    。我们不仅可以在手机上查看房间的温湿度,还可以通过手机远程控制SK3主控板的工作时间,达到真正的人工智能管理。在我看来,这就是人工智能人工智能
    发表于 03-23 17:00

    天津大学与中科视拓共建“人工智能联合实验室”

    本帖最后由 一只耳朵怪 于 2018-5-25 10:29 编辑 在世界智能大会刚刚闭幕、天津大学刚刚揭牌“人工智能学院”之际,人工智能公司中科视拓即与天津大学宣布建立“人工智能
    发表于 05-25 10:19

    人工智能的影响超乎你想象

    其很容易人工智能技术击败,改造起来反而更加容易。一是这些企业拥有行业海量的数据,充沛的资金;二是在生产力水平急需提升、人口红利逐渐消失的情
    发表于 06-22 14:40

    人工智能和机器学习的前世今生

    摘要: 阅读本文以了解更多关于人工智能、机器学习和深度学习方面的知识,以及它们对商业化意味着什么。如果正确的利用模式识别进行商业预测和决策,那么会为企业带来巨大的利益。机器
    发表于 08-27 10:16

    “洗牌”当前 人工智能企业如何延续热度?

    在少数的企业身上,强者恒强、弱者淘汰的局面已经形成。此外,截然不同的是,上至***机构下至平民百姓,对当下的人工智能项目不再盲目追捧,而是提出异议和担忧。9月20日,知乎用户质疑科大讯飞翻译技术“造假
    发表于 11-07 11:49

    解读人工智能的未来

    眼前的人工智能只是泡沫浮动,很快就会破灭。更诱人认为人工智能会威胁到我们的工作,甚至威胁社会。现如今的人工智能帮助我们的只是一些简单的工作
    发表于 11-14 10:43

    人工智能医生未来或上线,人工智能医疗市场规模持续增长

    监督学习和可解释机器学习等。   “人工智能不会替代医生,但懂人工智能的医生可能会替代不懂人工智能的医生。”联影
    发表于 02-24 09:29

    什么是基于云计算的人工智能服务?

    如今,采用人工智能企业遇到了一个主要障碍,那就是在内部开发人工智能产品成本高昂,因此有了外包人工智能产品的需求。而对于从中小企业到预算受限
    发表于 09-11 11:51

    目前人工智能教育研究最深入最经典的白皮书:德勤《全球人工智能发展白皮书2019》精选资料分享

    1、 人工智能正全方位商业化当前人工智能技术已步入全方位商业化阶段, 并对传统行业各参与方产生不同程度的影响, 改变了各行业的生态。这种变革主要体现在三个层次。第一层是企业变革:人工智能
    发表于 07-27 07:23

    中国人工智能的现状与未来

    机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任通常需要人类智能才能完成的复杂工作。那人工智能知识体系有哪些内
    发表于 07-27 06:40

    人工智能芯片是人工智能发展的

    人工智能芯片是人工智能发展的 | 特伦斯谢诺夫斯基责编 | 屠敏本文内容经授权摘自《深度学习 智能时代的核心驱动力量》从AlphaGo的人
    发表于 07-27 07:02

    什么是人工智能、机器学习、深度学习和自然语言处理?

    垂直领域得到广泛应用。根据2020年的一项估计,37% 的组织已经在使用这种或那种形式的人工智能。大多数人工智能的应用是特定的技术,如计算机视觉、自然语言处理、语音识别、机器学习和专家系统。让我们来看看
    发表于 03-22 11:19

    基于工作流技术的发电企业管理信息系统的研究与开发

    基于工作流技术的发电企业管理信息系统的研究与开发 传统的发电企业管理信息系统存在不支持业务流程等诸多缺点。本文将工作流管理技术与管
    发表于 07-20 14:39 777次阅读