0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘聊天机器人的“大脑”-大语言模型

NVIDIA英伟达 来源:NVIDIA英伟达 2024-04-17 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如果说 AI 正处于改变历史的“iPhone 时刻”,那么聊天机器人就是其首批热门应用之一。

聊天机器人的诞生离不开大语言模型,这是一种基于大规模数据集进行预训练的深度学习算法,能够识别、总结、翻译、预测和生成文本及其他形式的内容。这类模型可以在由 NVIDIA GeForce 和 RTX GPU 提供支持的 PC 和工作站上本地运行。

大语言模型擅长总结大量文本,通过数据分类和挖掘来获取见解,以及按照用户指定的风格、语气或形式生成新文本。它们可以促进以各种语言进行的交流,甚至包括人类语言之外的非常规“语言”,例如计算机代码或蛋白质和基因序列。

首代大语言模型只能处理文本,但后续迭代针对其他类型的数据进行了训练。这些多模态大语言模型可以识别和生成图像、音频、视频和其他内容形式。

像 ChatGPT 这样的聊天机器人是首批将大语言模型带给消费者的技术应用之一,它们提供了人们熟悉的界面,可以用自然语言提示词对话并作出回复。此后,大语言模型用于帮助开发者编写代码,以及协助科学家推进药物研发和疫苗研制。

然而,很多 AI 模型对算力的需求也不容小觑。将各类先进优化技术和算法(例如量化)与专为 AI 打造的 RTX GPU 结合,可为大语言模型“剪枝”,以使其可运行于 PC 本地,而无需连接互联网。Mistral(为 Chat with RTX 提供支持的大语言模型之一)等新型轻量化大语言模型的异军突起,降低了对算力和存储空间的需求。

为何说大语言模型很重要?

大语言模型的适用性很宽,可用于各个行业和工作流。借助这种多功能性及其本身的高速性能,大语言模型能够为几乎所有基于语言的任务带来性能和效率提升。

9156d6cc-fbdd-11ee-a297-92fbcf53809c.jpg

运行在云端 NVIDIA GPU 上的 DeepL

通过 AI 提供精准的翻译服务。

由于通过 AI 和机器学习来确保输出的准确性,因此像 DeepL 这样的大语言模型被广泛应用于语言翻译。

医学研究人员正在使用教科书和其他医学数据训练大语言模型,以期改善患者护理。零售商正在利用由大语言模型赋能的聊天机器人,为用户提供出色的客户支持体验。金融分析师正在利用大语言模型记录财报电话会议及其他重要会议,并总结会议内容。而这些只是大语言模型应用方式的冰山一角。

Chat with RTX 等聊天机器人和基于大语言模型构建的写作助手正在知识型工作的方方面面留下自己的身影,无论是内容营销、文案写作还是法律相关的任务。编码助手是大语言模型首批支持的应用之一,预示着由 AI 辅助开发软件的未来。目前,ChatDev 为代表的项目,就是将大语言模型和 AI 智能体(可自主帮助回答问题或执行任务的智能机器人)结合起来,构建了由 AI 驱动的,可按需提供服务的虚拟软件公司。用户只需告诉系统需要何种应用,就可以看着系统开展工作了。

如同日常对话一般轻松

许多人第一次接触生成式 AI 是通过 ChatGPT 等聊天机器人,这类机器人通过自然语言简化了大语言模型的使用方式,用户只需告诉模型需要做什么即可。

由大语言模型提供支持的聊天机器人可以帮助起草营销文案,提供度假建议,撰写客户服务邮件,甚至创作原创诗歌。

大语言模型在图像生成和多模态方面取得的进步,扩展了聊天机器人的应用领域,增加了分析和生成图像的功能,同时保留了简单易用的用户体验。用户只需向机器人描述图像或上传照片并要求系统对其进行分析即可。除了聊天之外,还可以利用图像做视觉辅助。

未来的技术进步将帮助大语言模型扩展在逻辑、推理、数学等方面的能力,赋予它们复杂的请求分解为更小子任务的能力。

AI 智能体方面也取得了进展,这类应用能够接受复杂提示词,将其分解为更小的提示词,并自主与大语言模型和其他 AI 系统合作,以便完成提示词交代的任务。ChatDev 是一种典型 AI 智能体,并不意味着智能体的仅能用于技术型任务。

例如,用户可以要求个人 AI 旅行智能体为全家预订出国度假游。该智能体可以将该任务分解为多个子任务,包括行程规划、预订旅游项目和住宿、创建装箱单、寻找遛狗服务人员,然后按顺序逐一独立执行。

借助 RAG 解锁个人数据

虽然大语言模型和聊天机器人在通用场景下已经非常强大,但如果能与个人用户的数据结合使用,它们将变得更加实用。通过这种方式,它们可以帮助分析电子邮件以发现各种趋势,梳理内容繁复的用户手册以找到某个技术问题的解答,或综合和分析多年累积的银行和信用卡对账单。

将特定数据集与大语言模型挂接,检索增强生成(RAG)是最简单有效的方法之一。

91844756-fbdd-11ee-a297-92fbcf53809c.jpg

PC 上的 RAG 示例。

RAG 可利用从外部来源获取的事实资料来提高生成式 AI 模型的准确性和可靠性。通过将大语言模型与几乎任意外部资源连接,用户可通过 RAG 与数据仓库“对话”,同时大语言模型也能借助 RAG 直接引用来源。用户体验相当简便,只需为聊天机器人指明文件或目录即可。

例如,在内容策略最佳实践、营销手段以及对特定行业或客户群体的基本见解等方面,标准的大语言模型具备相关常识。然而,如果通过 RAG 将其与用于产品发布的营销素材连接起来,大语言模型将能够分析内容并帮助规划量身定制的策略。

RAG 适用于任何大语言模型,只要应用本身支持 RAG 即可。NVIDIA Chat with RTX 是通过 RAG 将大语言模型连接到个人数据集的一个演示示例。它可本地运行于配备了 GeForce RTX GPU 或 NVIDIA RTX 专业 GPU 的系统上。

体验 Chat with RTX 的速度与私密性

Chat With RTX 是一款能在本地运行的个性化聊天机器人演示应用,不仅易于使用,还可免费下载。它基于 RAG 构建,且支持 TensorRT-LLM 和 RTX 加速 Chat With RTX 支持多个开源大语言模型,包括 Llama 2 和 Mistral。对 Google 的 Gemma 模型的支持将在后续更新中提供。

919a5da2-fbdd-11ee-a297-92fbcf53809c.jpg

Chat with RTX 可通过 RAG

将用户与其个人数据连接起来。

用户只需将文件放入一个文件夹,并为 Chat With RTX 指明该文件夹的位置,即可轻松将 PC 上的本地文件连接到受支持的大语言模型。之后,Chat With RTX 便可快速回答各类查询,给出相关的回复。

Chat with RTX 运行在 GeForce RTX PC 和 NVIDIA RTX 工作站的 Windows 系统上,因此其速度很快,同时用户的数据保存在本地。Chat with RTX 并不依赖基于云的服务,用户可以在本地 PC 上处理敏感数据,因此无需与第三方共享数据或连接互联网。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • GPU芯片
    +关注

    关注

    1

    文章

    307

    浏览量

    6553
  • 聊天机器人
    +关注

    关注

    0

    文章

    348

    浏览量

    13111
  • ChatGPT
    +关注

    关注

    31

    文章

    1599

    浏览量

    10390
  • 大模型
    +关注

    关注

    2

    文章

    3750

    浏览量

    5268

原文标题:解码 AI:揭秘聊天机器人的“大脑” - 大语言模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大晓机器人发布开悟3.0,国产世界模型机器人拥有“超级大脑

    机器人的使命就是让每个机器人都拥有一个聪明的大脑,洞察万物,学会与视觉精准交互。   在此背景下,大晓机器人凭借其原创的“世界模型”技术体系
    的头像 发表于 12-25 09:25 2753次阅读
    大晓<b class='flag-5'>机器人</b>发布开悟3.0,国产世界<b class='flag-5'>模型</b>让<b class='flag-5'>机器人</b>拥有“超级<b class='flag-5'>大脑</b>”

    走进广汽!图为科技揭秘人形机器人

    “超级大脑” 核心技术  12 月 11 日,《走进广汽集团,共探人形机器人产业新生态》主题沙龙在广汽研究院圆满落幕。 作为粤港澳机器人与人工智能生态联盟邀约企业,图为科技安排其研发总监钟其达携
    的头像 发表于 12-12 16:22 598次阅读
    走进广汽!图为科技<b class='flag-5'>揭秘</b>人形<b class='flag-5'>机器人</b>

    探索RISC-V在机器人领域的潜力

    SLAM等轻量级算法时表现出了不错的性能,CPU占用率在可接受范围内。整个系统响应及时,证明了MUSE Pi Pro完全有能力作为小型移动机器人的“大脑”。 四、 其他功能浅尝 • AI模型部署
    发表于 12-03 14:40

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    【EASY EAI Orin Nano开发板试用体验】基于RKLLM大模型聊天机器人

    计划在EASY EAI Orin Nano开发板部署QWEN大模型,然后通过部署flask服务将其web化,成为一个web聊天对话机器人,最后再对接语音识别模块,最终实现一个语音聊天机器人
    发表于 08-07 16:52

    机器人芯片:智能机器的“大脑”与未来趋势

    机器人技术的快速发展离不开核心硬件——机器人芯片。作为机器人的“大脑”,芯片决定了机器人的计算能力、响应速度和智能化水平。随着人工智能(AI
    的头像 发表于 07-31 13:43 1330次阅读

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练
    的头像 发表于 07-14 11:49 1257次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人</b>学习

    NVIDIA RTX AI PC为AnythingLLM加速本地AI工作流

    语言模型(LLM)基于包含数十亿个 Token 的数据集训练而来,能够生成高质量的内容。它们是众多最热门 AI 应用的核心支撑技术,包括聊天机器人、智能助手、代码生成工具等。
    的头像 发表于 07-04 15:05 1066次阅读

    小智 AI 聊天机器人 (XiaoZhi AI Chatbot)

    小智 AI 聊天机器人是一款基于开源硬件的智能对话设备,由开发者“虾哥”以 ​MIT 许可证发布,旨在帮助用户入门 AI 硬件开发,将大语言模型(LLM)应用于实体设备中。小智 AI 聊天机器
    的头像 发表于 05-30 15:56 1.5w次阅读
    小智 AI <b class='flag-5'>聊天机器人</b> (XiaoZhi AI Chatbot)

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    ,提高语音识别的准确率;同时也可连接高质量的扬声器,确保语音合成后的声音清晰、自然。TF卡接口能够存储大量的语音数据、对话模型以及语音机器人的知识库,使其具备更丰富的语言表达和知识储备。以太网和WIFI
    发表于 05-28 11:36

    从机械应答到深度交互,移远通信如何让机器人“灵魂觉醒”?

    率先推出了端&云混合大模型机器人大脑解决方案。该方案深度融合AI、大模型、声源定位等前沿技术,宛如为机器人赋予了“超级大脑”和“敏锐听觉”,
    的头像 发表于 05-20 19:04 1055次阅读
    从机械应答到深度交互,移远通信如何让<b class='flag-5'>机器人</b>“灵魂觉醒”?

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    大象机器人成立于2016年,专注协作机器人研发与应用,产品线涵盖轻量级协作机器人、人形机器人、仿生机器人等多种形态。拳头产品myCobot系
    发表于 04-25 17:59