0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

NVIDIA英伟达企业解决方案 来源:未知 2023-03-25 09:10 次阅读

NVIDIA NeMo 服务帮助企业将大型语言模型与其专有数据相结合,赋能智能聊天机器人、客户服务等更多应用。

如今的大型语言模型知识渊博,但它们的工作方式有点像时间胶囊——所收集的信息仅限于第一次被训练时所使用的数据。例如,如果在一年前进行训练,那么驱动 AI 聊天机器人的大型语言模型就不会知道最近的产品或者服务。

通过最近发布的 NVIDIA AI Foundations 云服务系列中的 NVIDIA NeMo 服务,企业可以很好地填补这一缺口。企业用户可以使用专有数据来增强他们的大型语言模型,从而能够经常更新模型的知识库,而不必从头开始重新训练这些模型。

NeMo 服务中的这一新功能使大型语言模型能够从专有数据源中检索准确的信息,并为用户查询生成类似人类的对话式答案。有了这一功能,企业可以使用 NeMo 为其应用程序定制能够定期更新、拥有特定领域知识的大型语言模型。

这可以帮助企业跟上库存、服务等领域不断变化的形势,解锁高精度人工智能聊天机器人、企业搜索引擎和市场情报工具等功能。

NeMo 包括为语言模型的响应引用来源的能力,从而增加用户对输出的信任。使用 NeMo 的开发人员还可以设置护栏来定义人工智能的专业领域,从而更好地控制生成的响应。

Quantiphi 是一家以 AI 为先的数字工程解决方案和平台公司,也是 NVIDIA 的服务交付合作伙伴之一。它正在与 NeMo 合作,构建一个名为 baioniq 的模块化生成人工智能解决方案,帮助企业构建定制的大型语言模型,以提高工人的生产力。其开发团队正在创建一些工具,使用户可以在几秒钟内搜索非结构化文本、图像和表格中的最新信息。

为“暗数据”带来光明

分析师估计,大约有三分之二的企业数据没有被开发。这些信息被称为“暗数据”,它们未被开发的原因之一是很难从大量数据中收集到有意义的洞察。现在,有了 NeMo,企业可以使用自然语言提示从这些数据中获取洞察。

NeMo 可以帮助企业建立能够从不断变化的知识库中学习并做出反应的模型,无论该模型最初使用什么数据集进行训练。开发人员不需要为了新的信息而重新训练模型,只需要更新一个数据库作为该模型的记忆库即可。新增加的信息可以被添加到这个数据库中,而不需要修改大型语言模型在语言处理和文字生成方面的核心能力。

企业还可以设置护栏来定义人工智能的专业领域,生成式 AI 应用将不会对专业领域外的话题发表观点或意见。

掀起新一轮企业生成式 AI 应用的热潮

通过使用业务数据定制大型语言模型,企业可以使他们的 AI 应用变得敏捷、快速响应:

  • 聊天机器人:许多企业已使用 AI 聊天机器人在网站上与客户保持基础的互动。通过 NeMo,企业可以构建所在专业领域的虚拟专家。

  • 客户服务:企业可以使用最新产品的细节来更新 NeMo 模型,帮助现场服务人员运用最新信息,更加轻松地回答客户的问题。

  • 企业搜索:企业拥有非常丰富的资料,包括技术文档、公司政策和 IT 支持文档等。员工可以使用一个由 NeMo 驱动的内部搜索引擎,更快、更容易地检索信息。

  • 市场情报:金融行业需要收集关于全球市场、上市公司和经济趋势的洞察。通过将大型语言模型连接到定期更新的数据库,投资者和其他专家可以从大量信息中快速识别出有用的细节,比如监管文件、财报电话会议录音或财务报表等。

想在应用中添加生成式 AI 功能的企业可以申请抢先体验 NeMo 服务。(https://developer.nvidia.com/nemo-llm-service-early-access)

点击“阅读原文”,观看 NVIDIA 创始人兼首席执行官黄仁勋 NVIDIA GTC 主题演讲中关于 NVIDIA AI Foundations 的部分。

5c54e8ee-caa9-11ed-bfe3-dac502259ad0.gif  

3 月 24 日 下午 14:00-16:00,继续锁定 GTC23,加入在线观看(Watch Party) 派对,从黄仁勋与 OpenAI 创始人兼首席科学家高能对话中,看 AI 的现状和未来!

Watch Party 观看指南

会议开始前 15 分钟,

点击下方出现的“JOIN WATCH PARTY NOW"

进入 Teams 会议室观看

5c680140-caa9-11ed-bfe3-dac502259ad0.png

3 月 24 日 热门观看派对推荐 【炉边谈话:看 AI 的现状和未来】 会议时间:14:00 - 16:00 会议代码:【WP52092】点击下方链接解会议详情 GTC23 | 黄仁勋与 Ilya Sutskever 的炉边谈话重磅来袭!— 看 AI 的现状和未来 【通过 AI 职业生涯改变世界】 会议时间:19:30 - 21:30 会议代码:【WP52162】 点击下方链接了解会议详情 : GTC23 | 科学计算精选论坛中文解读诚邀您的到来!


原文标题:GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3747

    浏览量

    90833

原文标题:GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何利用大型语言模型驱动的搜索为公司创造价值

    大型语言模型LLMs具有自动化内容创建、提高内容质量及多样化的潜力,可重塑企业与信息的交互方式。通过利用LLMs,企业能提升工作效率,降低运
    的头像 发表于 10-13 08:07 129次阅读
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>驱动的搜索为公司创造价值

    【《大语言模型应用指南》阅读体验】+ 俯瞰全书

    ,了解此书的主要内容: 书分四篇,基础、入门、进阶和展望。 基础篇从人工智能起源开始、之后又介绍了机器学习、神经网络和大语言模型的基础知识,如果读者学习过机器学习相关课程,那这个基础篇的阅读就会很轻
    发表于 07-21 13:35

    基于CPU的大型语言模型推理实验

    随着计算和数据处理变得越来越分散和复杂,AI 的重点正在从初始训练转向更高效的AI 推理。Meta 的 Llama3 是功能强大的公开可用的大型语言
    的头像 发表于 07-18 14:28 480次阅读
    基于CPU的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>推理实验

    富士通与Cohere合作,专注于开发和提供大型语言模型(LLM)

    富士通(Fujitsu)与总部位于多伦多与旧金山的顶尖安全及数据隐私人工智能企业Cohere Inc.携手宣布建立深度战略合作伙伴关系,共同致力于大型
    的头像 发表于 07-16 16:55 460次阅读

    LLM之外的性价比之选,小语言模型

    。然而在一些对实时性要求较高的应用中,比如AI客服、实时数据分析等,大语言模型并没有太大的优势。   在动辄万亿参数的LLM下,硬件需求已经遭受了不小的挑战。所以面对一些相对简单的任务,规模较小的小
    的头像 发表于 06-03 05:15 2182次阅读
    LLM之外的性价比之选,小<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    了解大型语言模型 (LLM) 领域中的25个关键术语

    1.LLM(大语言模型大型语言模型(LLMs)是先进的人工智能系统,经过大量文本
    的头像 发表于 05-10 08:27 1217次阅读
    了解<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b> (LLM) 领域中的25个关键术语

    【大语言模型:原理与工程实践】大语言模型的应用

    的创造力进行结合,从而创造出更加丰富多样的内容。随着技术的不断发展,自动提示生成技术有望逐渐成熟。这将使大语言模型变得更加自主,能够自行构建
    发表于 05-07 17:21

    【大语言模型:原理与工程实践】大语言模型的评测

    计算和代码纠错等。这些场景覆盖日常生活和学习的多个方面,使得对话能力评测变得尤为复杂和关键。为了全面评估大语言模型在各种应用场景下的对话能力,研究人员和使用者需要一套综合性的评测框架。该框架主要包括评测
    发表于 05-07 17:12

    Snowflake推出面向企业AI的大语言模型

    Snowflake公司近日推出了企业级AI模型——Snowflake Arctic,这是一款大型语言模型(LLM),专为满足
    的头像 发表于 05-07 10:03 453次阅读

    【大语言模型:原理与工程实践】大语言模型的基础技术

    之后,成为文本建模领域的热门架构。不仅如此,它还对自然语言处理领域产生了深远的影响。基于Transformer的预训练模型,如GPT系列和BERT系列,已在多种任务上取得了卓越的成绩。目前的大型
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    语言模型(LLM)是人工智能领域的尖端技术,凭借庞大的参数量和卓越的语言理解能力赢得了广泛关注。它基于深度学习,利用神经网络框架来理解和生成自然
    发表于 05-04 23:55

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》

    《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言
    发表于 04-30 15:35

    OpenVINO™助力谷歌大语言模型Gemma实现高速智能推理

    大型语言模型(LLM)正在迅速发展,变得更加强大和高效,使人们能够在广泛的应用程序中越来越复杂地理解和生成类人文本。
    的头像 发表于 03-17 17:17 815次阅读
    OpenVINO™助力谷歌大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>Gemma实现高速<b class='flag-5'>智能</b>推理

    语言模型推断中的批处理效应

    随着开源预训练大型语言模型(Large Language Model, LLM )变得更加强大和开放,越来越多的开发者将大
    的头像 发表于 01-04 12:32 595次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>推断中的批处理效应

    探索高效的大型语言模型大型语言模型的高效学习方法

    大型语言模型(LLMs)的应用中,提示工程(Prompt Engineering)是一种关键技术,用于引导模型生成特定输出或执行特定任务。通过精心设计的提示,可以显著提高LLMs的性
    发表于 12-13 14:21 565次阅读
    探索高效的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>!<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的高效学习方法