0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

企业级生成式AI应用,如何克服“幻觉”问题

jf_WZTOguxH 来源:AI前线 2023-09-21 16:00 次阅读

“最近我被问到最多的一个问题,是 IBM 现在还在做 AI 吗?我想告诉大家的是,IBM 是一家混合云与 AI 公司,我们一直在做 AI,并且专门做企业级 AI。”IBM 大中华区首席技术官、研发中心总经理谢东在日前接受媒体采访时强调。

面对今年以来热度一路狂飙的生成式 AI,作为 AI 发展史上的重要参与者,IBM 并没有“闲着”。今年 5 月,IBM 发布了企业级 AI 和数据平台 watsonx;自 7 月份以来,各个模块陆续上市;预计在今年年底到明年初,全部功能模块将会上市。其中,watsonx.data 的 premise 版本现在已经可以提供给中国客户。

如谢东强调,IBM 在其中锚定的依旧是“企业级”市场,延续长期以来的产品和生态定位。

然而,企业级 AI 应用与个人 AI 应用需求之间存在巨大差异,对技术本身的要求也不在一个量级。仅拿当下生成式 AI 应用最让人诟病的“AI 幻觉”问题来说,放在企业级生产环境,对此几乎是“零容忍”。

根据 IBM 商业价值研究院最近发布的面向全球超过 30 个国家和地区、超过 3000 名 CEO 的调研报告显示,61% 的受访 CEO 表达了对生成式 AI 中所使用的数据来源的担忧。

“这一担忧侧面反映了企业 AI 应用之路面临着重重挑战:首先是技术挑战,尤其是数据的准备、应用和治理;第二是人才挑战,企业需要快速实现人员技能的转型和提升,来拥抱 AI 浪潮;第三是文化挑战,技能的转型往往伴随组织文化的更新,如何让二者互相成就、带来生产力的提高,这需要优秀的管理智慧。”IBM 大中华区董事长、总经理陈旭东指出。

据此,在 IBM 看来,在企业落地 AI 应用有三个关键点:聚焦自身的业务需求、使用企业自己的数据、量身定制生成式 AI 解决方案和模型。那么,IBM watsonx 究竟是什么?又如何满足企业级 AI 应用的如上需求?本文将为大家揭晓。

企业使用 AI,关注的是它“不能做什么”和“不允许做什么”

从“AI 幻觉”问题说起。

企业使用 AI,不只是关心它“能做什么”,更要关注的是它“不能做什么”,以及“不允许它做什么”。AI 的可信性、可解释性非常关键。因为企业决策与经营直接相关,企业使用 AI,要避免给业务带来技术风险,因此对智能分析的准确率要求高,容错率低。

在谢东看来,消灭“幻觉”归根结底要从最初的数据抓起。“想让 AI 的回答是正确的,至少要保证训练的数据是干净合规的,数据本身的完整性、信息量要合乎要求。”他告诉 InfoQ。

IBM watsonx 正在试图解决这些问题。根据官方释义,它提供一个包括 AI 开发平台 watsonx.ai、数据存储平台 watsonx.data 和 AI 治理平台 watsonx.governance。

其中,watsonx.data 针对企业中海量且复杂的数据,可以通过集中治理和本地自动化策略实施来确保数据的安全性和合规性;此外,watsonx.governance 还采用了软件自动化来帮助企业增强能力以降低风险、满足监管要求和应对 AI 伦理问题,使得企业能够自动化和整合多个工具、应用程序和平台,同时可以记录数据集、模型、相关元数据和管道的来源。

“另一方面,幻觉的产生是因为在大模型中缺失了相应的信息,克服的方法是使用企业自己的数据,把企业的数据输入给它,这样至少可以在特定业务领域减少幻觉的产生。”谢东补充说。

据了解,除了原始数据和专有数据,企业还可以带入自己的数据来丰富和改进他们的目标模型,所有数据都存储在 watsonx.data 中,其中包含有关每个文件或文档的详细元数据,以提供可追溯的治理。在数据的过滤和处理过程中,平台首先会识别数据的来源和 ID,然后对数据进行分类和过滤,对重复数据和不合规数据进行分析和清除。并且,对数据进行版本控制和标记。在过滤和预处理后,每个数据集都会获得一个数据名片。数据名片包含数据堆的名称和版本,以及其内容和已应用的过滤器等其他相关内容。

“换句话说,IBM 非常清楚自己用于训练模型所有的数据及其版本,也会告诉用户我们的模型是由哪些数据训练而来,并且后期还有很多调优的工作,以此增强用户对模型的信心。”谢东进一步解释。

事实上,从现阶段来看,几乎所有生成式模型都可能产生幻觉,都会给出一些不相关或不准确的答案。尤其典型的是,当提示模型去处理一个它没有接受过训练的题目或者用的训练集数据不足时,AI 幻觉很难不发生。

对此,据 IBM 透露,其内部还在研究一种降低 AI 幻觉风险的方法,名为“检索增强生成”,意在使模型能够在生成答案之前从知识库中检索相关数据。

IBM 大中华科技事业部数据人工智能、自动化中国华南与华东大区总经理许伟杰表示,IBM 正在通过模型融合进一步解决这一问题。“大语言模型所做的最重要的一件事是语义理解,目前我们正在通过语义识别,基于 IBM watsonx 能力做精准答案确定。也就是说,利用通用语言大模型的方式了解语义,帮助既有的模型实现既有答案的匹配,再回溯给语义大模型。”

基础模型带来拐点,数据无需再打标签

值得一提的是,IBM watsonx 平台聚焦于特定业务领域的基础模型。基础模型基于特定类型的 Transformer 神经网络架构而构建,为生成相关数据元素的序列(例如句子)而设。非常重要的一点在于,Transformer 架构能够帮助基础模型理解未标记数据,并将输入转换为输出,从而生成新的内容(ChatGPT 就是基于 Transformer 架构开发)。

“以前基于深度学习机器学习算法,通常要对海量数据打标签,再交给机器进行学习。并且,经过学习和部署,这个模型也只能做一个特定的事情,比如用于人脸识别或者下棋。”谢东解释道。

换言之,深度学习和机器学习的痛点在于,前期工作巨大,但最终输出的算法模型能应用的范围非常局限,“性价比”不高。

有别于此,基础模型允许在大量未标记的数据上进行训练,可以适应新的场景和用例。尽管基础模型也需要前期大量投资,但每次使用时,它都会摊销 AI 模型构建的初始工作,因为微调基于基础模型构建的其他模型的数据要求要比从头开始构建低得多。这既可以大幅提高投资回报率(ROI),又可以大大缩短上市时间。

因此,在 IBM 看来,基础模型把 AI 技术发展带到一个拐点——使企业级 AI 的加速和扩展成为可能。

“我们认为,相较于通用大语言模型,企业应该更加关注基础模型。”谢东解释道,“在企业应用 AI 的时候,除了大语言模型,还会有不同的应用场景,包括 IT 自动化模型、数字劳动力的模型、网络安全模型等等,这些不同的专业模型支撑了这些企业级应用。”

据了解,IBM 目前正在构建一系列针对多种类型的业务数据进行训练的特定领域的基础模型,包括代码、时间序列数据、表格数据、地理空间数据、半结构化数据和混合模态数据(如文本与图像的组合)。IBM 认为,这些基础模型的灵活性和可扩展性将显著加速企业对 AI 的采用。

在今年 7 月举办的 2023 温网锦标赛上,IBM 已经利用 watsonx 为大赛所有视频集锦提供生成式 AI 解说,并且,基于 IBM AI Draw Analysis 提供的一套全新的统计数据,还可以使用 AI 来预测单打抽签中每个球员进入决赛的可能性。

大模型不一定越“大”越好

有了基础模型,下一个解决的问题是,企业如何根据自身的业务需求,选择适用的模型。谢东强调,所谓“适用”,意味着模型不一定越“大”越好。因为,企业在任何技术领域的投入都是以驱动经营为目的,更在乎其中的投入产出比。

一方面,虽然模型越“大”,其知识和能力也越强,但是成本投入也是巨大的。对于企业而言,很多应用场景的落地并不在于模型本身大小,而在于多大程度符合企业特定要求,能不能很好地完成任务,匹配业务目标;

另一方面,支持一个大模型的训练和运行非常消耗算力,模型上线之后,企业业务本身仍然在不断变化,这要求模型具备适应性和可扩展性,系统能力也要不断学习和进化。而出于运维成本的考虑,“小”模型反而比“大”模型更加节约且灵活。

“在这个过程中,基础模型要演化出各种不同应用,还需要有新的自动化工具和项目管理方法,实现持续的训练、调试、部署等工作。”谢东举例,IBM watsonx 就是这样一个平台工具,IBM 希望借此减轻企业的 AI 负担,让企业可以更轻松地实现大规模开发、调整和部署企业级 AI。

举例来说,基于 watsonx.ai,AI 开发者就可以利用 IBM 自有的模型和 Hugging Face 的模型来完成一系列 AI 开发任务。这些模型经过预训练,可以支持一系列自然语言处理 (NLP) 类型的任务,包括问答、内容生成和摘要、文本分类和提取。据了解,未来的版本还将提供更多由 IBM 训练的针对提升相关领域效率和任务专业化的专有基础模型的访问。

事实上,多年来,IBM 一直在帮助企业把 AI 部署到核心应用中,从而增强企业生产力。据菜鸟科技首席科学家、菜鸟物流科技部算法总监王子豪介绍,菜鸟与 IBM 在 AI 开放和赋能方面有很多共性,菜鸟物流最早在快递行业提出了神经网络驱动的大规模地址分单技术,并且陆续在仓储、客服、供应链等环节实现了广泛的智能化升级,包括在仓储场景应用机器视觉、推出物流智能客服和快递末端地理大模型、基于决策智能技术构建菜鸟全球供应链网络等等。并且,菜鸟还在无锡构建了亚洲最大规模的智能调度现场,最高峰期可以调度同时 1000 台飞机。

但是,随着基础模型的演进,以及生成式 AI 的兴起,的的确确给各行业 AI 的规模化广泛应用带来了新的变化。

谢东强调:“我们需要从以前数据为先的‘+AI’时代迈入 AI 为先的‘AI+’时代。这个说法不光是一个加号在前在后,当我们说 +AI 的时候,注重的是以数据为中心,企业是在数据应用的层面上附加一些 AI 的能力。而当我们走到 AI+ 的阶段,意味着企业需要建立起 AI 的基础能力,在这基础上,我们需要进一步结合企业自身的数据和不同的业务目标,构建新的核心应用。”

写在最后

对于企业而言,IBM watsonx 是一个全新的 AI 和数据平台工具,那么,如何才能让这个工具“物尽其用”?

除了搞定数据质量、数据共享的问题之外,IBM Consulting 大中华区总裁陈科典表示,企业中还必须具备相应的文化、人才和制度。“企业需要去提升内部人才的能力,培养新的文化,如此以来,才能让内部对生成式 AI 的信心越来越充足,那么,更多的场景才会被创造出来。”

具体而言,IBM 认为在生成式 AI 的技术背景下,相关技术人员需要至少具备两类能力:一是理解业务场景,能够针对业务目标,对模型进行训练和调整;二是理解企业自己的数据,知道数据分布在哪里,使用过程中的标准和规则等等。

IBM 大中华区客户成功管理部总经理朱辉强调,“生成式 AI 的应用现在基本还处于‘打开脑洞’的阶段,所以我们特别强调共创。因为有构建大模型能力的人,不一定拥有业务场景的支持,而拥有业务场景的企业,也不一定具有建设大模型的能力。这也是 IBM 一直以来的战略定位,热衷于提供基础能力,与合作伙伴和客户共创解决方案,从而解决客户的问题。而不是拿出一个现成方案,告诉别人这就是你应该要的东西。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1749

    浏览量

    74621
  • AI
    AI
    +关注

    关注

    87

    文章

    30106

    浏览量

    268392
  • 大模型
    +关注

    关注

    2

    文章

    2322

    浏览量

    2477

原文标题:企业级生成式 AI 应用,如何克服“幻觉”问题

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA NIM Agent Blueprint加速企业级AI应用落地

    生成 AI 时代,每个企业都在尝试构建自己的 AI 应用,来赋能企业提高业务能力,提高盈利预
    的头像 发表于 11-13 11:35 248次阅读

    生成AI在制造业的应用现状和前景展望

    在上一期《IBM 企业级 AI 为跨国制造业智能化注入新动力》的文章中,我们重点分享了 IBM 企业级AI驱动智能制造升级的若干场景,视觉检测技术及知识库平台的应用案例;接下来,我们将
    的头像 发表于 11-06 17:06 508次阅读

    AI驱动存储需求激增,企业级SSD市场迎来国内厂商崛起

    随着人工智能(AI)应用的迅速普及,市场对高性能、高可靠性的存储产品的需求日益增长,企业级固态硬盘(SSD)因此受到了前所未有的关注。当前,全球SSD市场主要由五大原厂主导,但在中国,随着AI浪潮的推动,
    的头像 发表于 10-28 14:18 381次阅读

    Inflection AI携手英特尔推出企业级AI系统

    近日,AI初创企业Inflection AI与英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi 3 AI加速器和Tiber AI C
    的头像 发表于 10-09 16:40 382次阅读

    谷歌Vertex AI助力企业生成AI应用

    过去的一段时间,我们看到了许多 Google Cloud 客户对生成 AI 和 agent 的精彩应用,令我们拍案叫绝。为了让企业能够更快推出功能强大的
    的头像 发表于 09-09 15:59 455次阅读

    esp32-c3连接不上aruba企业级路由器怎么解决?

    通过idf连接企业级路由器时连接不上。手机能正常连上,查看路由器管理页面发现手机连上的验证方式为peap + mschapv2方,而idf中无此组合的配置。
    发表于 06-11 08:06

    中国开源软件推进联盟携手IBM发布《可信赖的企业级生成AI白皮书》

    今天,IBM 在北京举行“AI for Business论坛”,与客户、合作伙伴、生态联盟等行业参与者一起,探讨如何将生成 AI 应用到企业
    的头像 发表于 05-23 18:26 863次阅读

    生态系统即战略,是IBM将企业级AI技术带给行业客户的主力军

    ,这些C端应用只是暴露于海面的一角,深藏于海面之下的是体量庞大、影响更深、更广的企业级AI市场。根据麦肯锡的研究,整体上生成AI每年可为全
    的头像 发表于 05-17 09:56 329次阅读

    Snowflake推出企业级AI模型

    Snowflake公司近日重磅推出了一款名为Snowflake Arctic的企业级大型语言模型(LLM)。这款AI模型针对复杂的企业工作负载进行了深度优化,特别是在SQL代码生成和指
    的头像 发表于 05-06 14:38 386次阅读

    江波龙进军企业级存储,万事俱备坚定高端之路

    国内存储行业龙头企业江波龙经过二十多年的耕耘,已经成为面向消费电子、嵌入、工业、车规存储的佼佼者,并转型为半导体存储品牌企业。就在20
    的头像 发表于 03-25 14:19 1428次阅读

    NVIDIA推出生成AI微服务,供开发者在CUDA GPU系统中创建部署生成AI助手

    NVIDIA 于今日推出数十项企业级生成 AI 微服务,企业可以利用这些微服务在自己的平台上创建和部署定制应用,同时保留对知识产权的完整所
    的头像 发表于 03-20 09:56 437次阅读

    阿里云推出企业级大模型RAG系统

    在国际AI大数据峰会上,阿里云重磅推出了企业级大模型检索增强生成(RAG)解决方案。这一解决方案旨在为企业提供更强大、更智能的大模型应用工具,帮助
    的头像 发表于 02-05 09:54 1115次阅读

    企业级SSD-高性能系列固态硬盘推荐

    除了传统的机械盘HDD,固态硬盘SSD也开始慢慢地在企业级硬盘领域发挥重要的作用。由于企业级固态硬盘的价格远远高于机械硬盘,因此固态硬盘在企业级领域应用还不是很广泛,但是就发展趋势而言,很有可能会全面代替机械硬盘。
    的头像 发表于 01-23 16:48 1150次阅读
    <b class='flag-5'>企业级</b>SSD-高性能系列固态硬盘推荐

    NVIDIA 通过企业级生成 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

    AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成
    的头像 发表于 11-29 21:05 591次阅读

    NVIDIA 通过企业级生成 AI 微服务 为聊天机器人、AI 助手和摘要工具带来商业智能

    。   NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强
    发表于 11-29 14:37 267次阅读
    NVIDIA 通过<b class='flag-5'>企业级</b><b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 微服务 为聊天机器人、<b class='flag-5'>AI</b> 助手和摘要工具带来商业智能