0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

搭建一个 AI 问答机器人,需要几步?

科技讯息 来源:科技讯息 作者:科技讯息 2024-10-21 15:10 次阅读

搭建一个企业内部AI 问答机器人、知识库的场景,我们可以选择大厂的云服务,这相对于大多数用户来说,是最省事的方案。但很多企业可能会有一些私有化的数据,或者受限于企业内部的安全性要求,只能走模型私有化部署的方式。

很多人想到模型私有化部署,会以为要数据中心的多台服务器来做,其实不然。

办公室里搭建 AI 工作站,已经可以完美地支持企业内部知识库和一些POC场景的需求,比如进行量化的 70B 模型的训练和推理工作。所以在办公室环境下,同样可以搭建一个 AI 问答机器人。

赞奇科技基于 NVIDIA ChatRTX 搭建的企业问答机器人

但搭建一个AI 问答机器人又是一个涉及硬件选择安装开发环境部署的综合过程。

最近赞奇的工程师团队测试了几款主流大模型,就采用 AI 工作站搭建一个本地问答机器人提供了一些建议参考,这里抓一些重点给大家:

第一步 确定需求与目标

这一步至关重要,需要确定以下关键点:

性能要求:了解所做任务的复杂度,如知识库所需要采样的数据库的大小,未来的用户并发量等,以此来预估所需的计算资源和存储空间等,通常我们可以用现有机器跑任务测试的方式来评估。

预算范围:明确愿意投入的资金等成本范围。对预算没有概念的小伙伴可以通过询问,或者参考公开市场价格等方式来加速了解。

第二步 选择合适的硬件

根据需求我们来制定硬件配置,AI 工作站比较关键的配置有 GPUCPU、内存、机箱等。

GPU

GPU 是 AI 工作站中非常核心的算力,也是 AI 工作站中需要首先考虑的配件。目前适用于专业 AI 工作站的显卡主要有 NVIDIA RTX™ 5880 Ada (48GB)NVIDIA RTX™ 5000 Ada (32GB) 等,这两款显卡属于 NVIDIA 专业级显卡,主动散热功耗很低而且非常稳定,静音也适合办公室使用。

我们可以看看两款显卡的参数:

wKgZoWcV_luAbe-1AAKmYmv-U6k722.png

我们需要根据算力需求来配置工作站中的显卡,包括显卡型号和数量。AI 工作站可至多支持 4 张高性能专业显卡,同时一个工作站中需要配置同一型号的显卡,并且一般采用单卡、双卡和四卡的配置。

这就需要我们同时要了解不同型号显卡的性能,才能来匹配任务需求。这是个极大的挑战。很多人对显卡性能并不熟悉,而且在不同的任务情况下,显卡的表现也会有所不同。我们可以参考与我们类似的任务在显卡上的测评数据来评估。有条件的话,在购买时建议最好提前测试下。

显卡实测数据

很多企业采用 AI 工作站来做知识库、智能问答等应用,主要任务是本地的模型微调和推理,模型大小普遍选择在 7B/8B,13B,32B 和 70B。

NVIDIA 解决方案合作伙伴赞奇科技,分别对 AI 工作站中搭载 NVIDIA RTX 5880 Ada、NVIDIA RTX 5000 Ada 的单卡双卡四卡配置进行了模型训练和推理的测试,测试数据供大家在选型时参考。

AI 工作站搭载 NVIDIA RTX 5000 Ada 的实测

NVIDIA RTX 5000 Ada

(图片源于 NVIDIA)

测试环境:

CPU: Intel(R) Xeon(R) w5-3433

内存:64G DDR5 * 8

GPU: NVIDIA RTX 5000 Ada * 4

操作系统:ubuntu22.04

Driver Version: 550.107.02

CUDA: 12.1

推理框架:vllm

测试数据(以下数据均为多次测试数据的平均值):

wKgZoWcV_l2AA6IIAAJulUCUQF0866.pngwKgaoWcV_l2AMwsuAAHiZvbmz2s629.pngwKgZoWcV_l6ASr9zAAGmT9d4jpk924.png


AI 工作站搭载 NVIDIA RTX 5880 Ada 的实测

NVIDIA RTX 5880 Ada

(图片源于 NVIDIA)

测试环境:

CPU: Intel(R) Xeon(R) w5-3433

内存:64G DDR5 * 8

GPU: NVIDIA RTX 5880 Ada * 4

操作系统:ubuntu 22.04

Driver Version: 550.107.02

CUDA: 12.1
推理框架:vllm

测试数据(以下数据均为多次测试数据的平均值):

wKgZoWcV_l-AExbqAAN3lME3fKU187.pngwKgaoWcV_l-AXDo2AAI6T-7eMQU419.pngwKgZoWcV_mCAINGKAAGzPFsA528770.png

噪音测试

无论是搭载 4 张 NVIDIA RTX 5880 Ada, 还是 4 张 NVIDIA RTX 5000 Ada 的品牌 AI 工作站,在压测情况下机器出风口测得的噪音水平控制在 50-60 分贝,基本上接近环境音的水平,办公室噪音?那是没有的!

以上测试数据均来源于赞奇科技 。

wKgaoWcV_mCAO9wzAAB5yiXrvSU36.jpeg

其他配置

CPU 要注意考虑和 GPU 的匹配问题。实际使用中,具有较高核心数和主频的CPU 运行速度更快,更高的缓存也会提升运行效率。4卡工作站环境中内存建议 256GB 以上,存储也要依据使用需求来确定。

机箱要考虑电源、噪音、兼容性、扩展性等因素,电源的话要计算所有组件的最大功率消耗并留有余量,以应对峰值和未来硬件升级的可能。噪音和散热情况一定要提前了解,因为这会直接影响办公环境(还有心情)。

当然也可以更省事一点儿,参考我们本次测试所采用的工作站的配置环境!

第三步

安装操作系统、配置开发环境+

AI 工作站到位安装好后,可以根据偏好和软件兼容性,选择合适的操作系统、驱动程序、软件等进行安装。同时配置开发环境所需的工具、模型、数据集等。

当然,您也可以联系我们,一站式配置好软硬件相关的环境,做到开箱即用!

第四步

测试与优化

通过运行一些基本的小型 AI 项目,验证工作站在实际任务中的运行速度、稳定性、散热情况、噪音等情况。同时还可以利用 NVIDIA System Management Interface 等工具监控 GPU 使用情况,根据需要调整代码或资源配置以提高显卡效率。

实际过程中,大部分靠谱厂商出厂过程中会包含上述步骤。此时我们需要做的工作是在上述环境准备完善的前提下,上传自己的数据,通过 RAG 或者微调的方式对自己的数据做一次整理。接下来,就迎接自己内部的问答机器人吧!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28379

    浏览量

    206914
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102987
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
收藏 人收藏

    评论

    相关推荐

    发现机器人,《机器人的中秋祝福》中的机器人有眼部投影功能哦

    `发现了机器人,《机器人的中秋祝福》中的机器人有眼部投影功能哦,双手还挺灵活的,好像是国内的,就是外观比较
    发表于 09-13 14:40

    如果有AI机器人,你希望它每天帮你做哪些事?

    完成更多的工作,给人们生活带来的便利;二来是AI机器人是否会影响人类的行为动作,最终取代人类。这些被讨论了千万遍的话题,暂时还没有定论。如果你家里有
    发表于 10-23 16:03

    AI语音智能机器人开发实战

    第四期直播PPT下载:第三期直播PPT+程序下载:第二期直播PPT下载:第期直播PPT下载:主题简介及亮点:以AI智能语音陪护机器人为载体,彻底讲解整个机器人研发的全流程,从开发环境
    发表于 01-04 11:48

    聊天机器人的自动问答技术实现

    【原创】聊天机器人与自动问答技术
    发表于 06-03 08:47

    使用旅游机器人需要注意哪些问题?

    决消费者的咨询问题,机器人就是很好的载体。机器人甚至可以把客户基本的需求都解决了。  如今的人脸识别越来越成熟,机器人的人脸识别也会成为
    发表于 06-12 17:04

    AI智能语音机器人 揭秘让企业电销轻松拓客神器

    创造普惠全民以及企业的“智”“慧”将来,创建天下最大的AI通讯办事平台。作为互联网项目领导者,智能电话机器人先行者,刚推出百应全自动电
    发表于 07-21 22:54

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡检机器人开发

    本帖最后由 马猛 于 2020-11-26 10:17 编辑 项目名称:基于HiSpark AI Camera HarmonyOS 智能巡检机器人开发试用计划:HiSpark AI
    发表于 11-18 18:15

    【HarmonyOS HiSpark AI Camera】厅堂机器人

    项目名称:厅堂机器人试用计划:申请理由:机器人项目集成摄像头实现人脸识别跟随,熟悉鸿蒙系统。项目名称:厅堂机器人项目计划:一个月内实现机器人
    发表于 11-19 20:49

    AI智能电销外呼机器人-自动拨打电话

    的问题,这点我们是非常自豪的。现在很多市面上的机器人五花八门的、贴牌的大堆,根本没有保障,甚至有问题都不知道该找谁处理。而我们的AI外呼机器人
    发表于 09-02 10:35

    如何利用树莓派搭建完整的机器人系统?

    如何利用树莓派搭建完整的机器人系统?
    发表于 01-18 06:37

    如何搭建实体机器人ros底盘

    目录介绍、底盘主控板二、嵌入式开发板1. 与上位机pc的关系2. 与STM32主控板的关系介绍自下而上的分析实体机器人(差分轮速机器人搭建中的关键过程。
    发表于 01-20 07:36

    机器人是什么?

    机器人是什么?你可能会对这个问题本身感到困惑。.有意思。.但是在实际的机器人技术中,这是广阔的领域。机器人学这个术语指的是
    发表于 03-31 10:31

    制作教育机器人

    描述K-Bot版本4机器人的设计理念是,任何人都可以使用教育机器人进行组装、编程和教学活动。主要是为了让任何教育水平的老师都能在课堂上和学生起使用它。为了做到这点,你只
    发表于 08-19 07:25

    【入群体验】电子行业首个群聊式AI问答机器人正式上线

    什么?智能机器人工具1、小秋Chat可以做什么2、你可以问报价3、你可以问替代料4、你可以咨询设计问题5、帮忙写程序写代码6、电子技术知识7、更多功能等你来发掘如何加入群聊和小秋Chat起玩群聊AI
    发表于 04-12 18:02

    如何开发款自己的智能问答机器人

    人工智能时代,开发款自己的智能问答机器人方面提升自己的AI能力,另方面作为转型
    的头像 发表于 01-19 10:26 7599次阅读
    如何开发<b class='flag-5'>一</b>款自己的智能<b class='flag-5'>问答</b><b class='flag-5'>机器人</b>