英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署-电子发烧友网

前言

在当今的企业环境中，信息的快速获取和处理对于企业的成功至关重要。为了满足这一需求，我们可以将RAG技术与企业本地知识库相结合，以提供实时的、自动生成的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境，提高企业的竞争力和创新能力。

企业本地知识库是一个集中存储和管理企业内部知识的系统。它包含了企业的历史数据、经验教训、最佳实践、流程文档、产品信息等。企业本地知识库是企业智慧的结晶，对于企业的运营和发展具有重要意义。

将RAG技术与企业本地知识库相结合，可以为企业带来以下几个方面的优势：

实时性

RAG技术可以实时地从企业本地知识库中提取相关信息，并生成用户所需的内容。这意味着用户可以快速地获取到最新的知识和信息，而不需要花费大量时间去查找和整理。

自动化

RAG技术可以自动地处理和生成内容，减少了人工干预的需求。这不仅可以提高企业的效率，还可以减少人为错误的发生。

个性化和定制化

RAG技术可以根据用户的需求和偏好，生成个性化的内容。通过与企业本地知识库的结合，可以提供更加精准和有针对性的信息，满足不同用户的需求。

知识共享和传承

企业本地知识库是一个集中存储和共享知识的平台。通过与RAG技术的结合，可以将这些知识快速地传递给需要的用户，促进知识的共享和传承。

RAG简介

RAG - Retrieval-Augmented Generation（检索增强生成）是一种先进的自然语言处理（NLP）技术，它结合了信息检索（Retrieval）和神经网络生成（Generation）两种方法，以提升模型在生成文本时的准确性和相关性。在传统的生成模型中，模型依据自身学习到的知识库生成文本。然而，这种方法受限于模型训练时所接触到的数据范围，特别是在处理未见的、需要实时查找新信息的场景时，可能无法生成最新或最准确的内容。

RAG模型通过引入一个检索组件，在接收到输入问题或任务后，首先从大规模预定义的知识库（如网页、文档集合或其他结构化/非结构化数据源）中检索与任务相关的信息片段。然后，检索到的信息作为额外的上下文输入，与原始输入一起传递给生成模型。生成模型在此基础上，利用检索到的信息以及自身的语言模型能力，生成更为精确、详尽且与现实世界信息保持同步的回答或文本内容。

简单来说，RAG模型就是在传统生成模型的基础上增加了一个动态获取外部知识的能力，这样既保留了大模型生成连贯文本的优点，又解决了由于模型记忆限制导致的知识更新和准确性不足的问题，尤其适用于问答系统、对话系统及需要实时更新信息的自然语言处理任务。

OpenVINO Notebook简介

OpenVINO Notebooks是一套以Jupyter Notebook为载体的开源交互式编程教程和示例代码合集，由英特尔公司开发和维护。这套资源专为使用 OpenVINO 工具套件的开发者设计，旨在帮助他们更快地理解和掌握如何利用 OpenVINO 进行深度学习模型的优化与推理及实际部署AI在各式业务应用场景里面。

部署平台简介

算力魔方是一款可以DIY的迷你主机，采用了抽屉式设计，后续组装、升级、维护只需要拔插模块。通过选择计算模块的版本，再搭配不同额 IO 模块可以组成丰富的配置，适应不同场景。性能不够时，可以升级计算模块提升算力, 如需要显卡可加上显卡， IO 接口不匹配时，可以更换 IO 模块调整功能，而无需重构整个系统。本文在带有英特尔12代酷睿i7-1265U芯片组里的锐炬 Xe集成显卡+RAM 32GB的算力魔方上完成验证。

在集成显卡上部署RAG

4.1

搭建OpenVINO Notebooks开发环境

第一步：请使用下面的命令克隆存储库创建并激活名为“openvino_env”的虚拟环境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

第二步：请使用下面的命令激活虚拟环境并安装依赖包，并启动Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

jupyter lab notebooks

4.2

下载模型到本地

请使用命令将ChatGLM3 6B和text2vec模型下载到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

4.3

运行254-rag-chatbot程序

请运行Notebooks里面的代码模块, 注意!! 国内用户请勿运行模块1，从模块2开始一步步运行代码到NNCF模块，模型压缩选择int4并按照下图一及二图修改notebooks 254里的代码引导程序指定对应的模型路径完成ChatGLM3-6b模型int 4量化及部署

图一

图二

text2vec-large-chinese 模型部署

运行结果，如下所示：本地知识库已成功加入ChatGLM 6B模型里并精确回答问题

运行视频.avi

总结

将RAG技术与企业本地知识库相结合，可以为企业提供实时、自动化、个性化和定制化的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境，提高企业的竞争力和创新能力。

利用OpenVINO 工具套件简单易用，仅需三步即可在算力魔方完成开发环境搭建及模型的INT4量化且在英特尔集成显卡上的部署实现RAG企业本地知识库部署。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
10035

浏览量
172523
深度学习

深度学习

+关注

关注
73

文章
5521

浏览量
121679
大模型

大模型

+关注

关注
2

文章
2677

浏览量
3293
OpenVINO

OpenVINO

+关注

关注
0

文章
101

浏览量
255

原文标题：英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署 | 开发者实战

文章出处：【微信号：英特尔物联网，微信公众号：英特尔物联网】欢迎添加关注！文章转载请注明出处。

英特尔与扣子云平台合作推出AI PC Bot专区和端侧插件商店

通过创新的端云协同技术，为开发者提供更为便捷、高效的智能应用开发环境。通过扣子的“端插件”机制，英特尔AI PC的PC操控、本地知识库、本地

发表于 12-31 10:24 •310次阅读

英特尔与扣子云平台合作推出AI PC Bot专区与端侧插件商店

。 Coze-AIPC是扣子云平台与英特尔联合发布的增强版智能体开发平台，它深度整合了英特尔AI PC的端侧能力与扣子云平台的优势。通过扣子云平台创新的“端插件”机制，英特尔

发表于 12-27 14:11 •446次阅读

使用英特尔AI PC为YOLO模型训练加速

之后，情况有了新的变化，PyTorch2.5正式开始支持英特尔显卡，也就是说，此后我们能够借助英特尔 锐炫显卡来进行模型训练了。

发表于 12-09 16:14 •599次阅读

使用PyTorch在英特尔独立显卡上训练模型

《PyTorch 2.5重磅更新：性能优化+新特性》中的一个新特性就是：正式支持在英特尔独立显卡上训练模型！

发表于 11-01 14:21 •866次阅读

英特尔聚焦AI座舱

英特尔推出首款锐炫车载独立显卡（dGPU）和第一代英特尔软件定义车载SoC系列，满足当前消费者对汽车内部配备更多屏幕、获得更高清晰度等AI座舱体验需求。

发表于 10-30 16:26 •257次阅读

Inflection AI携手英特尔推出企业级AI系统

近日，AI初创企业Inflection AI与英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi

发表于 10-09 16:40 •513次阅读

【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

非常明显的短板。尽管这些模型在理解和生成自然语言方面有极高的性能，但它们在处理专业领域的问答时，却往往不能给出明确或者准确的回答。这时就需要接一个专有知识库来满足产品专有和专业知识的

发表于 09-29 17:12

IBM Cloud将部署英特尔Gaudi 3 AI芯片

近日，科技巨头IBM与英特尔宣布了一项重大合作计划，双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI芯片，预计该服务

发表于 09-03 15:52 •438次阅读

英特尔携手星环科技WAIC展现AI Infra

PC版等。此外，星环主办的“新质生产力：AI Infra构筑企业新动能”主题论坛同时亮相上海世博中心，邀请了包括英特尔在内的多家业界大咖，展望AI基础设施建设趋势，探讨如何基于大

发表于 08-16 15:02 •598次阅读

【AIBOX】装在小盒子的AI足够强吗？

Firefly推出大语言模型本地部署的产品：AIBOX-1684X，目前已适配主流的大语言模型，

发表于 05-15 08:02 •555次阅读

华擎推出AI QuickSet软件，支持英特尔锐炫Arc A系列显卡

今日，华擎宣布将AI QuickSet软件工具扩展至英特尔锐炫Arc A系列显卡，使其能够便捷地安装Stable Diffusion web UI OpenVINO，结合英特尔Open

发表于 05-11 10:58 •713次阅读

英特尔酷睿Ultra处理器突破500个AI模型优化

英特尔在最新推出的英特尔® 酷睿™ Ultra处理器上宣布，超过500款AI模型已得到优化运行。这款处理器无疑是市场上领先的AI PC处理器

发表于 05-09 11:18 •855次阅读

英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

英特尔丰富的AI产品——面向数据中心的至强处理器，边缘处理器及AI PC等产品为开发者提供最新的优化，助力其运行Meta新一代大语言模型Me

发表于 04-28 11:16 •720次阅读

简单三步使用OpenVINO™搞定ChatGLM3的本地部署

英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件，可帮助开发人员和企业加速生成式人工智能 (AIGC)、大语言

发表于 04-03 18:18 •2269次阅读

浪潮信息"源2.0"大模型YuanChat支持英特尔最新商用AI PC

% 。企业可以在全新的英特尔商用客户端AI PC上，使用AI PC大模型效率工具"YuanChat"快速

发表于 03-27 22:52 •579次阅读